一.概述 Impala 是参照google 的新三篇论文Dremel(大批量数据查询工具)的开源实现,功能类似shark(依赖于hive)和Drill(apache),impala 是clouder 公司主导开发并开源,基于 hive并使用内存进行计算,兼顾数据仓库,具有实时,批处理,多并发等优点.是使用cdh 的首选PB 级大数据实时查询分析引擎.(也可以单独安装使用,但一般都是和CDH一起使用:) 参考: https://www.cloudera.com/products/open-sour…