Mahout: Machine Learning en Hadoop

El Machine Learning es una disciplina muy compleja (verdad Luis?).

Normalmente decimos al programa que debe hacer: query, controlador,…

Machine Learning es una técnica para enseñar a los programas que deben hacer…

Y dónde entra Hadoop(=Big Data) aquí…pues si nos creemos las frases de: “No gana quien tiene los mejores algoritmos, si no quien tiene más datos” o “No hay mejor dato que más datos”

Mahout es una librería de Machine Learning escrita en Java y optimizada para funcionar sobre Hadoop (entendiendo por Hadoop HDFS y MapReduce), la ventaja de usar Mahout es que ya tiene un gran número de algoritmos implementados para trabajar sobre las tres Cs del Machine Learning:

Collaborative filtering: técnica para recomendaciones (por ejemplo en base a personas a quien le gustan ciertos temas recomendar otros temas que pudieran gustarles)

Clustering: para descubrir estructuras en colecciones de datos (grupos de sensores relacionados)

Classification: es una técnica supervisada (las otras dos no) para descubrir relaciones (por ejemplo en base a los mails spam etiquetar nuevos mails)

Podéis ver el listado de algoritmos soportados aquí.

Respuesta

  1. Jajaja ja… Que bueno! Mi profe de Machine Learning coincide contigo en lo de los algoritmos vs cantidad de datos.

Replica a Luis Cancelar la respuesta