
El Machine Learning es una disciplina muy compleja (verdad Luis?).
Normalmente decimos al programa que debe hacer: query, controlador,…
Machine Learning es una técnica para enseñar a los programas que deben hacer…
Y dónde entra Hadoop(=Big Data) aquí…pues si nos creemos las frases de: “No gana quien tiene los mejores algoritmos, si no quien tiene más datos” o “No hay mejor dato que más datos”
Mahout es una librería de Machine Learning escrita en Java y optimizada para funcionar sobre Hadoop (entendiendo por Hadoop HDFS y MapReduce), la ventaja de usar Mahout es que ya tiene un gran número de algoritmos implementados para trabajar sobre las tres Cs del Machine Learning:
– Collaborative filtering: técnica para recomendaciones (por ejemplo en base a personas a quien le gustan ciertos temas recomendar otros temas que pudieran gustarles)
– Clustering: para descubrir estructuras en colecciones de datos (grupos de sensores relacionados)
– Classification: es una técnica supervisada (las otras dos no) para descubrir relaciones (por ejemplo en base a los mails spam etiquetar nuevos mails)
Podéis ver el listado de algoritmos soportados aquí.

Replica a Luis Cancelar la respuesta