Presto es un motor open-source distribuido de queries SQL para ejecutar queries analíticas sobre datasources de grandes volúmenes.

Presto permite consultar datasources como Hive, Cassandra, bases de datos relacionales,… también permite combinar datos de diversas fuentes.

Facebook usa Presto para queries interactivas sobre diversos data stores incluyendo su data warehouse de 300 PB (unos 1000 empleados de Facebook usan diariamente Presto para ejecutar más de 30.000 queries).

Presto es un sistema distribuido que corre en un cluster de máquinas, incluyendo un coordinador y múltiples workers. Las queries se envían desde un cliente hacia el coordinador, que parsea, analiza y planea el plan de ejecución de la query y tras esto distribuye el procesamiento hacia los workers:

Ofrece estos conectores:

Leer más