Si ayer publicábamos

¿Qué es PivotalR?

Hoy nos toca hablar de MADlib:

MADlib funciona sobre PivotalR (ofreciendo un interfaz SQL para Greenplum, HAWQ y Postgresql) ofreciendo modelos estadísticos y de machine-learning.

MADlib ofrece funcionalidades como

· Classification

· Regression

· Clustering

· Topic Modeling

· Association Rule Mining,

· Descriptive statistics

· Validation

Además de para estas bases de datos existe un porting de MADLib para Impala:

Lo que nos permite usar Impala para hacer Machine Learning como puede verse en este ejemplo.

Veamos una sintaxis típica MADlib: