Hadoop生态圈

生态圈

   1. HBase的数据存储在HDFS里

   2. MapReduce可以计算HBase里的数据,也可以计算HDFS里的数据

   3. Hive是数据分析数据引擎,也是MapReduce模型,支持SQL

   4. Pig也是一个数据分析引擎,不支持SQL,有自己的Pig Latin数据

   5. Sqoop是数据采集工具,针对关系数据库

   6. Flume是针对文件等数据的采集

    7. Hadoop的HA通过Zookeeper来实现

    8. HUE是个插件,可以对Hadoop的生态进行图形化管理。

Hadoop的生态

你可能感兴趣的:(Hadoop生态圈)