¿Qué es Pivotal HD?

Pivotal HD es la nueva distribución Hadoop de Greenplum.

El objetivo de esta distribución es incrementar las capacidades de Hadoop como plataforma de datos.

En Pivotal HD Pivotal HD’s incluye además de las capacidades típicas de Hadoop:

· HAWQ que es una base de datos relacional de alto rendimiento que corre en HDFS, para eso a HDFS se le han añadido capacidades de truncado para soportarla.

  • Command Center que permite gestionar y monitorizar HDFS, MapReduce y HAWQ.

  • Virtualization extensions and Isilon support
  • ICM (Installation/Configuration/Management) : para la gestión de clusters
  • Spring Hadoop para simplificar el desarrollo con Hadoop. También se integra Spring Batch.

Lo más interesante y novedoso de esta distribución es su base de datos HAWK, que viene del desarrollo de bases de datos por parte de Greenplum. Sus características incluye:

· Almacenamiento por columnas o filas (Columnar or row-oriented) de forma transparente, HAWK sabe como almacenar, distribuir y hacer shard de los datos

· Particionamiento:

· Optimizador y planner de Queries en paralelo: toma las queries SQL y busca la major forma de devolver los datos

· Fully compliant SQL92 y SQL99: queries 100% compatibles con PostgreSQL 8.2

· Claves de distribución para poder hacer local joins y groups by

· Herramientas de Administración

· Drivers ODBC and JDBC para conectar con herramientas BI

Deja un comentario