Impala相较于hive的优劣

hive是基于Java编写的开源数据仓库和分析包,目的是将特定的SQL语句编译为MapReduce jar包扔给hadoop去执行,本质上是一个代码转换编译的工具,适用于逻辑复杂的查询,简单查询考虑impala。
impala是使用C++编写的基于hive的大数据查询分析sql执行引擎,使用到了Hive当中的Metastore。适用于实时数据分析,容错机制稍差,但重查一次的成本低,因为不支持UDF,能处理的问题域有一定的限制,与Hive配合使用,对Hive的结果数据集进行实时分析。

你可能感兴趣的:(Impala相较于hive的优劣)