Si ayer publicábamos
¿Qué es PivotalR?
Hoy nos toca hablar de MADlib:
MADlib funciona sobre PivotalR (ofreciendo un interfaz SQL para Greenplum, HAWQ y Postgresql) ofreciendo modelos estadísticos y de machine-learning.
MADlib ofrece funcionalidades como
· Classification
· Regression
· Clustering
· Topic Modeling
· Association Rule Mining,
· Descriptive statistics
· Validation
Además de para estas bases de datos existe un porting de MADLib para Impala:
Lo que nos permite usar Impala para hacer Machine Learning como puede verse en este ejemplo.
Veamos una sintaxis típica MADlib:




Deja un comentario