Hive中多行合并成一行以及一行扩展成多行的方法

1. 多行合并成一行:使用函数collect_list
假如现在数据表table1如下所示:
col1   col2    col3
A        B         1
A        B         2
A        C         3
A        C         4
我们想将col1和col2值相同的col3合并成一行,得到如下的数据表,使用函数collect_list
Col1    col2    col3
A       B       1,2
A       C       3,4

select col1,col2,concat_ws(“,” , collect_list(cast(col3 as string))) from table1 group by col1, col2


我们将col3转换为string,是因为concat_ws函数只接受string或者array的数据类型

还有一个collect_set,跟collect_list的区别是,前者会去重后再合并在一起。后者不会。

2. 一行扩展成多行
2.1 现有表table2如下:
Col1    col2    col3
A       B       [1,2]
A       C       [3,4]
我们想要
Col1   col2    col3
A      B       1
A      B       2
A      C       3
A      C       4
也就是把col3展开
使用函数explode。由于explode中不能select其他列,比如

你可能感兴趣的:(HQL,sql)