【003hive基础】hive的数据类型

文章目录

    • 一.数据类型
      • 1. 基础数据类型
      • 2. 复杂数据类型
    • 二. 显式转换与隐式转换
    • 三. hive的读时模式

一.数据类型

1. 基础数据类型

【003hive基础】hive的数据类型_第1张图片
 

2. 复杂数据类型

  • array: 有序相同数据类型的集合。 arrays(1, 2)
  • map : key必须是基本数据类型,value不限。 map(‘a’, 1, ‘b’, 2)
  • struct : 不同类型字段的集合。类似于 C语言的结构体。通过”点”得到所需要的元素,比如user是一个STRUCT类型,那么可以通过user.address得到这个用户的地址。
  • union : 不同类型的元素存储在同一字段的不同行中。create_union(1, ‘a’, 63)

 

这里创建一个包含复杂类型的表:

CREATE TABLE employees (
    name STRING,
    salary FLOAT,
    subordinates ARRAY<STRING>,
    deductions MAP<STRING, FLOAT>,
    address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>
) PARTITIONED BY (country STRING, state STRING);

 

二. 显式转换与隐式转换

Hive 中基本数据类型遵循以下层次结构, 按照这个层次结构, 子类型到祖先类型允许隐式转换。
【003hive基础】hive的数据类型_第2张图片

//String 转float、int 转float
hive> select '1.0'+2; 
3.0
//String 转int
hive> select '1111' > 10;
//int 转float
hive> select 1 > 0.8;

同时也可以使用 cast 函数进行强制类型转换;

hive> select cast('1111s' as int);
NULL  //强制类型转换失败, 返回 NULL
hive> select cast('1111' as int);
1111

 

三. hive的读时模式

Hive 中数据加载过程采用 “读时模式” (schema on read), 加载数据时不进行数据格式的校验, 读取数据时如果不合法则显示NULL。
这种模式的优点是加载数据迅速。 读时模式 -> 读时检查数据 -> Hive;

 
参考:
https://www.iteblog.com/archives/870.html

你可能感兴趣的:(#,hive,hive,大数据,hadoop)