OpenStack Sahara es un proyecto integrado en OpenStack cuyo objetivo es hacer elástico Hadoop bajo demanda.

Hadoop es prácticamente el estándar cuando hablamos de Big Data, las organizaciones típicamente comienzan montando un cluster . Incluso con las distribuciones comerciales este proceso es complejo.

Sahara está preparado para configurar, autodesplegar y escalar clusters Hadoop sobre OpenStack. Sahara ofrece por tanto capacidades Elastic Data Processing (EDP) sobre Hadoop al estilo de Amazon Elastic MapReduce.

Sahara permite:

· Crear clusters desde UI o bien integrar Sahara con tu aplicación vía el API

· Elegir entre diversas distribuciones, incluidas Hortonworks Data Platform (HDP) y Cloudera Hadoop Distribution (CHD).

· Soporte jobs Apache Spark.

· Configurar HDFS de forma sencilla

Sahara está integrado con los servicios core OpenStack como Keystone, Glance, Horizon y Nova, además soporta las APIS nativa OpenStack lo que permite a los usuarios provisionar entornos Hadoop desde el Horizon GUI.

Leer más