八天学会hadoop (5) hadoop 高可用 hive 入门

Hadoop 高可用

八天学会hadoop (5) hadoop 高可用 hive 入门_第1张图片

 

想要高可用 必须有两个namenode 一个active 一个standby  namenode中的edits文件由第三方qjournal(依赖zookeeper)保存。

 

 

 

hive 流程

 

八天学会hadoop (5) hadoop 高可用 hive 入门_第2张图片

 首先是create语句 会创建一些元信息存到元数据库 比如表名 创建时间

 下次执行查询语句 先经过hive的compiler模块生成java jar包 然后经过runner模块提交jar包 运行程序。

  hive 只能执行查询操作  不能进行进行添加操作 

hive 导入本地数据到hive表里面 实际上数据是传到/user/hive/warehouse/数据库/表 里面

八天学会hadoop (5) hadoop 高可用 hive 入门_第3张图片

 

hive 里面表分为managed table 和external 表  managed的表 数据统一在./user/hive/warehouse 如果drop掉的话 元数据信息和数据都会删除。 external 表数据自定义 如果drop掉 只会删除元数据信息哦。

hive 复制表语句

create table tab_ip_like like tab_ip;
insert overwrite table tab_ip_like select * from tab_ip;

 

 

hive 分区 本质

八天学会hadoop (5) hadoop 高可用 hive 入门_第4张图片

 

八天学会hadoop (5) hadoop 高可用 hive 入门_第5张图片

实际上就是在hdfs对应路径上面分了两个文件夹 数据分别存在两个文件下。

 

 

hive 还支持数组 map类型哦 在这里举个例子

八天学会hadoop (5) hadoop 高可用 hive 入门_第6张图片

八天学会hadoop (5) hadoop 高可用 hive 入门_第7张图片

 

hive 在shell环境下执行

八天学会hadoop (5) hadoop 高可用 hive 入门_第8张图片

 

 

 

 

 

 

 

 

 

 

 

你可能感兴趣的:(大数据学习)