Impala es un motor analítico de consultas SQL de alto rendimiento desde sus comienzos allí por 2013. Existen numerosos análisis que muestran la mejora de rendimiento sobre otras opciones en Hadoop (ver este).

En este artículo podéis ver como la versión 2.5 de Impala es capaz de mejorar hasta x4 comparando con la versión 2.3:

La mejora se nota en prácticamente todos los aspectos: filtros dinámicos, particionado dinámico, joins, agregaciones distribuidas, mejoras en el uso de la aritmética,…

Leer más