Hadoop Sqoop: paso base de datos relacional a Hadoop

(Gracias – otra vez – Luis :))

Como veíamos en este post Hadoop es una solución que permite aplicar MapReduce para resolver funcionalidad Big Data.

Dentro del ecosistema Hadoop (MapReduce, Pig, ZooKeeper, HBase, HDFS, Hive, Chukwa,…) es muy interesante Sqoop.

Apache Sqoop es un proyecto pensado para facilitar la importación y exportación de datos entre Hadoop y bases de datos relacionales.

· Sqoop permite hacer importaciones masivas de datos con HDFS, Hive y HBase.

· Sqoop está desarrollado en Java y usa MapReduce para transferir datos en paralelo.

· Trabaja con conectores, ofrece conectores estándares (basados en JDBC) y conectores directos para mejorar el rendimiento. Ofrece conectores directos para bases de datos como MySQL, Oracle, SQL Server,…

El Flujo de importación típico con Sqoop sería algo como esto:

En la versión 1 de Sqoop se trabaja con línea de comandos:

En la versión 2 de Sqoop se incluye una GUI de administración, configuración centralizada.

Tu voto:

Respuestas

Luis

julio 13, 2012 at 4:01 pm

Pues ahora vamos a por Apache Flume 😉

Responder
1. Luis Miguel Gracia Luis
  
  julio 13, 2012 at 4:11 pm
  
  je,je! de este finde no pasa 🙂 antes va el del ecosistema y luego ese 🙂
  
  Responder
Sqoop: Integrando Hadoop con nuestra base de datos « Un poco de Java

diciembre 3, 2012 at 12:44 pm

[…] En este escenario es especialmente útil Sqoop (del que ya hablamos en este post). […]

Responder

Hadoop Sqoop: paso base de datos relacional a Hadoop

Tu voto:

Comparte esto:

Respuestas

Deja un comentario Cancelar la respuesta