Hive--行转列/列转行

行转列/列转行

一、lateral view
- 案例1：与explode连用
- 案例2：与parse_url_tuple连用
二、explode
三、行列转换
- 行转列
- - 多行转多列
  - 多行转单列
- 列转行
- - 多列转多行
  - 单列转多行

一、lateral view

分类：视图
功能：配合UDTF来使用,把某一行数据拆分成多行数据
很多的UDTF不能将结果与源表进行关联，使用lateral view ，可以将UDTF拆分的单个字段数据与原始表数据关联上
使用方式：

select …… from tabelA lateral view UDTF(xxx) 视图名 as a,b,c

案例1：与explode连用

-- 假设我们有一张表pageAds，它有两列数据
-- 第一列是pageid(string类型)，第二列是adid_list(Array类型)，即用逗号分隔的广告ID集合：
pageid	 			adid_list
"front_page"		[1, 2, 3]
"contact_page"		[3, 4, 5]
 
-- 要统计所有广告ID在所有页面中出现的次数。

-- 首先分拆广告ID：

SELECT 
	pageid, adid 
FROM pageAds .
LATERAL VIEW explode(adid_list) adTable AS adid;
    
-- 执行结果如下：pageid(string类型),adid(int类型)
pageid		 adid
"front_page"	1
"front_page"	2
"front_page"	3
"contact_page"	3
"contact_page"	4
"contact_page"	5

-- 接下来就是一个聚合的统计：

SELECT 
adid, count(1) 
FROM pageAds 
LATERAL VIEW explode(adid_list) adTable AS adid
GROUP BY adid;

-- 执行结果如下：

adid	count(1)
1			1
2			1
3			2
4			1
5			1

案例2：与parse_url_tuple连用


--准备数据:vim /export/datas/lateral.txt
1	http://facebook.com/path/p1.php?query=1
2	http://www.baidu.com/news/index.jsp?uuid=frank
3	http://www.jd.com/index?source=baidu

--创建表
create table tb_url(
id int,
url string
) row format delimited fields terminated by '\t';
--加载数据
load data local inpath '/export/datas/lateral.txt' into table tb_url;
--使用UDTF解析
SELECT parse_url_tuple(url, 'HOST') from tb_url;

--使用UDTF+lateral view
select 
  a.*,
  b.host,
  b.path
from 
  tb_url a 
  lateral view parse_url_tuple(url, 'HOST',"PATH") b as host,path;

--对比
SELECT id,parse_url_tuple(url, 'HOST') from tb_url;--失败，UDTF函数不能与字段连用
select id, a.* from tb_url lateral view parse_url_tuple(url, 'HOST','PATH') a as host,path;

案例3:多个lateral view连用
一个FROM语句后可以跟多个lateral view语句，后面的lateral view语句能够引用它前面的所有表和列名。

-- 以下面的表为例：
--col1(Array类型) col2(Array类型)
col1		 col2
[1, 2]		[a", "b", "c"]
[3, 4]		[d", "e", "f"]

SELECT 
myCol1, col2
FROM baseTable
LATERAL VIEW explode(col1) myTable1 AS myCol1;
--执行结果为：mycol1(int类型)	 col2(Array类型)

mycol1	 	col2
1		[a", "b", "c"]
2		[a", "b", "c"]
3		[d", "e", "f"]
4		[d", "e", "f"]
 
--加上一个lateral view：

SELECT 
myCol1, myCol2 
FROM baseTable
LATERAL VIEW explode(col1) myTable1 AS myCol1
LATERAL VIEW explode(col2) myTable2 AS myCol2;

--它的执行结果为：mycol1(int类型)	 col2(string类型)
myCol1		myCol2
1			"a"
1			"b"
1			"c"
2			"a"
2			"b"
2			"c"
3			"d"
3			"e"
3			"f"
4			"d"
4			"e"
4			"f"
注意上面语句中，两个lateral view按照出现的次序被执行。

二、explode

分类：UDTF
功能：函数可以将一个array或者map展开
- explode(array)：
  将array列表里的每个元素生成一行
- explode(map)：
  每一对元素作为一行，key为一列，value为一列
使用方式：
- 直接使用
- 与lateral view连用
案例：

	1-实现wordcount【explode(array)】
		select explode(split(word," ")) from words;  --直接使用,word为array
	2-将兴趣爱好展开【explode(map)】
		select explode(hobby) from complex_map;  --直接使用,hobby为map
	3-与侧视图连用
		select a.name,b.* from complex_map a lateral view explode(hobby) b as hobby,deep;
		-- 与lateral view连用

三、行列转换

行转列

多行转多列

案例：多行转多列

-》创建数据：vim /export/datas/r2c1.txt
a	c	1
a	d	2
a	e	3
b	c	4
b	d	5
b	e	6
-》希望结果
+-------+----+----+----+--+
| col1  | c  | d  | e  |
+-------+----+----+----+--+
| a     | 1  | 2  | 3  |
| b     | 4  | 5  | 6  |
+-------+----+----+----+--+

准备


-》创建表
create table row2col1(
col1 string,
col2 string,
col3 int
)row format delimited fields terminated by '\t';

-》加载数据
load data local inpath '/export/datas/r2c1.txt' into table row2col1;

思考
- 原表中a和b都有多行，最后a和b都只有一行，肯定对第一列做了分组
- 结果有4列
  - 结果第一列：就是原来的第一列
  - 结果第二列：以a为例，对a的数据分组以后
    如果原表第二列是c，结果表的第二列就是1，取的是原表的第三列
    如果原表第二列是d，结果表的第三列就是2，取的是原表的第三列
    如果原表第二列是e，结果表的第四列就是3，取的是原表的第三列
  - a分组以后是3条

a	c	1
a	d	2
a	e	3
case col2 when 'c' then col3 else 0 end   =》 1  0  0  =》 1
case col2 when 'd' then col3 else 0 end   =》 0  2 	0  =》 2
case col2 when 'e' then col3 else 0 end   =》 0  0  3  =》 3

实现


select 
  col1 as col1,
  max(case col2 when 'c' then col3 else 0 end) as c,
  max(case col2 when 'd' then col3 else 0 end) as d,
  max(case col2 when 'e' then col3 else 0 end) as e
from 
  row2col1
group by 
  col1;

多行转单列

案例：多行转单列

准备

-》创建数据：vim /export/datas/r2c2.txt
a	b	1
a	b	2
a	b	3
c	d	4
c	d	5
c	d	6
-》希望结果：concat_ws(分隔符,col3)
+-------+-------+--------+--+
| col1  | col2  |  col3  |
+-------+-------+--------+--+
| a     | b     | 1,2,3  |
| c     | d     | 4,5,6  |
+-------+-------+--------+--+
-》创建表
create table row2col2(
col1 string,
col2 string,
col3 int
)row format delimited fields terminated by '\t';
-》加载数据
load data local inpath '/export/datas/r2c2.txt' into table row2col2;

实现


select 
  col1, 
  col2, 
  concat_ws(',', collect_set(cast(col3 as string))) as col3
from 
  row2col2
group by 
  col1, col2;

列转行

多列转多行

案例：多列转多行
需求

-》创建数据：vim /export/datas/c2r1.txt
a	1	2	3
b	4	5	6
-》希望结果
+-----------+-----------+-----------+--+
| _u1.col1  | _u1.col2  | _u1.col3  |
+-----------+-----------+-----------+--+
| a         | c         | 1         |
| b         | c         | 4         |
| a         | d         | 2         |
| b         | d         | 5         |
| a         | e         | 3         |
| b         | e         | 6         |
+-----------+-----------+-----------+--+

准备数据


-》创建表
create table col2row1(
col1 string,
col2 int,
col3 int,
col4 int
)row format delimited fields terminated by '\t';
-》加载数据
load data local inpath '/export/datas/c2r1.txt' into table col2row1;




或者

drop table if exists row2col1;
create table row2col1 as 
select 'a' as col1,1 as col2,2 as col3,3 as col4
union all
select 'b' as col1,4 as col2,5 as col3,6 as col4
;

方法一

select col1, 'c' as col2, col2 as col3 from col2row1
UNION ALL
select col1, 'd' as col2, col3 as col3 from col2row1
UNION ALL
select col1, 'e' as col2, col4 as col3 from col2row1;

不使用union all可以吗？
方法二

select split(value_list,':')[0] as col1
		,split(value_list,':')[1] as col2
		,split(value_list,':')[2] as col3
from (select concat_ws(',',concat(col1,':c:',col2),concat(col1,':d:',col3),concat(col1,':e:',col4)) as value
      from  col2row1
      )t
lateral view explode(split(value,','))v as value_list
;

还有一种不用union all的解法（某些场景下用会很优雅～）
方法三
- posexplode该函数可以将index和数据都取出来，使用posexplode并令取到的index相等就行了

select col1
    -- ,tb1.a as tb1a
    -- ,tb2.a as tb2a
    -- ,tb3.a as tb3a
    ,col2
    ,col3
from(select array(col1,col1,col1) as col1_list
        ,array('c','d','e') as col2_list
        ,array(col2,col3,col4)  as col3_list
    from  col2row1
    )t
lateral view posexplode(col1_list) tb1 as a,col1
lateral view posexplode(col2_list) tb2 as a,col2
lateral view posexplode(col3_list) tb3 as a,col3
where tb1.a=tb2.a and tb2.a=tb3.a
;

posexplode 我经常会用来做膨胀数据使用~供参考


select a.a 
    ,a.b 
    ,date_add('2023-08-01',pos) as dt
    ,pos+1						as n_day
from (select 1 as a ,2 as b 
    union all 
    select 3 as a ,4 as b 
    )a 
lateral view posexplode(split(repeat('a,a',datediff('2023-08-31','2023-08-01')),',')) tab as pos,day
-- lateral view posexplode(split(repeat('a,a',30),',')) tab as pos,day 
-- 这里如果直接写30会被炸开成31（n+1）
-- pos是从0开始，到30(repeat次数)
-- 为什么不是lateral view posexplode(split(repeat(',',datediff('2023-08-31','2023-08-01')),',')) tab as pos,day 呢？？？
-- 因为hive引擎下 和spark引擎下是不一样的，可以自行测试一下，hive 切出来不是你想要的。。。

-- select split(repeat(',',datediff('2023-08-31','2023-08-01')),','); 
--  	[]
-- select split(repeat('a,a',datediff('2023-08-31','2023-08-01')),','); 
-- ["a","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","aa","a"]	
order by dt desc
;

多表查询中 Join：多表之间列合并 union：多表之间行的合并

单列转多行

案例：单列转多行

准备

-》创建数据：vim /export/datas/c2r2.txt
a	b	1,2,3
c	d	4,5,6

-》希望结果
+-------+-------+-------+--+
| col1  | col2  | col3  |
+-------+-------+-------+--+
| a     | b     | 1     |
| a     | b     | 2     |
| a     | b     | 3     |
| c     | d     | 4     |
| c     | d     | 5     |
| c     | d     | 6     |
+-------+-------+-------+--+
-》创建表
create table col2row2(
col1 string,
col2 string,
col3 string
)row format delimited fields terminated by '\t';
-》加载数据
load data local inpath '/export/datas/c2r2.txt' into table col2row2;

实现

select 
col1, 
col2, 
lv.col3 as col3
from 
  col2row2 
lateral view explode(split(col3, ',')) lv as col3;

经常用来解析json套数组，这里举个case

SELECT
       statisticLadder_json
      ,get_json_object(statisticLadder_json, '$.activityId') as activityId
      ,get_json_object(statisticLadder_json, '$.strategyId') as strategyId
FROM ( SELECT '[{"activityId":1,"strategyId":2,"status":0,"strategyMatch":{"dmp":true,"property":false,"scene":true},"propertyMatch":{"clientType":false}},{"activityId":2,"strategyId":3,"status":0,"strategyMatch":{"dmp":true,"property":false,"scene":true},"propertyMatch":{"clientType":false}}]' as str
) a
    LATERAL view explode(split(regexp_replace(str,'^\\[|]$',''), ',(?!")')) b as statisticLadder_json
    
-- 结果
statisticLadder_json	activityId	strategyId
{"activityId":1,"strategyId":2,"status":0,"strategyMatch":{"dmp":true,"property":false,"scene":true},"propertyMatch":{"clientType":false}}	1	2	
{"activityId":2,"strategyId":3,"status":0,"strategyMatch":{"dmp":true,"property":false,"scene":true},"propertyMatch":{"clientType":false}}	2	3

Azkaban各种类型的Job编写 __元昊__
一、概述原生的Azkaban支持的plugin类型有以下这些：command：Linuxshell命令行任务gobblin：通用数据采集工具hadoopJava：运行hadoopMR任务java：原生java任务hive：支持执行hiveSQLpig：pig脚本任务spark：spark任务hdfsToTeradata：把数据从hdfs导入TeradatateradataToHdfs：把数据从Te
Linux（centos7）部署hive 灯下夜无眠 Linux linux hive 运维 dbeaver hive客户端
前提环境：已部署完hadoop(HDFS、MapReduce、YARN)1、安装元数据服务MySQL切换root用户#更新密钥rpm--importhttps://repo.mysql.com/RPM-GPG-KEY-mysqL-2022#安装Mysqlyum库rpm-Uvhhttp://repo.mysql.com//mysql57-community-release-el7-7.noarch.
centos7中的MySQL安装老伙子53 mysql 数据库
centos7中的MySQL安装一、MySQL5.7.17安装脚本#!/bin/bashcd/rootmkdirmysql_tarwgethttps://downloads.mysql.com/archives/get/p/23/file/mysql-community-server-5.7.17-1.el7.x86_64.rpmwgethttps://downloads.mysql.com/ar
CDH 启停使用HiveServer2 金刚_30bf
翻译：https://www.cloudera.com/documentation/enterprise/latest/topics/cdh_ig_hiveserver2_start_stop.html版本：5.14.2HiveServer2是HiveServer的改进版本，支持Kerberos身份验证和多客户端并发访问。您可以使用Beeline客户端访问HiveServer2。警告：如果以远程模
关于HDP的20道高级运维面试题编织幻境的妖运维
1.描述HDP的主要组件及其作用。HDP（HortonworksDataPlatform）的主要组件包括Hadoop框架、HDFS、MapReduce、YARN以及Hadoop生态系统中的其他关键工具，如Spark、Flink、Hive、HBase等。以下是对这些组件及其作用的具体描述：Hadoop框架:Hadoop是一个开源的分布式计算框架，用Java语言编写，用于存储和处理大规模数据集。它广义
【Caddy】Caddy实践1——此网站无法提供安全连接鲁正杰 Caddy 部署疑难杂症安全 ubuntu 网络
背景：卸载最近安装Caddy在另外一个机器上出现了错误，执行步骤如下：步骤一：添加Caddy软件源并安装执行以下命令添加Caddy的软件源并安装：sudoaptinstall-ydebian-keyringdebian-archive-keyringapt-transport-httpscurlcurl-1sLf'https://dl.cloudsmith.io/public/caddy/stab
hive sql实现查找商品表名称中包含敏感词的商品 lixia0417mul2 大数据 hive sql hadoop
背景用户上传的商品表一般会包含商品名称，由于这些商品名称是用户自己起的，里面可能包含了敏感词，需要通过sql找出来哪些商品的商品名称包含了敏感词汇hivesql实现查找商品表名称中包含敏感词的商品实现思路：1.商品表和敏感词表进行join时的连接条件设置成namecontains敏感词的形式2.一般来说join的on条件都只是需要有一个equal等值连接，所以我们每个表设置一个虚拟列，仅仅是为了满
大数据开发（Hive面试真题-卷二） Key-Key 大数据 hive 面试
大数据开发（Hive面试真题）1、举几个Hive开窗函数例子？什么要有开窗函数，和聚集函数区别？2、说下Hive是什么？跟数据仓库区别？3、Hive架构？4、Hive数据倾斜以及解决方案？5、Hive如果不用参数调优，在map和reduce端应该做什么？6、Hive的三种自定义函数是什么？实现步骤与流程？它们之间的区别？作用是什么？7、Hive分区和分桶的区别？8、Hive的执行流程？9、Hive
windows下用cmd命令netstat查看系统端口使用情况 wmh188
转:https://www.cnblogs.com/lvxiuquan/archive/2012/08/22/2650507.html开始--运行--cmd进入命令提示符输入netstat-ano即可看到所有连接的PID之后在任务管理器中找到这个PID所对应的程序如果任务管理器中没有PID这一项,可以在任务管理器中选"查看"-"选择列"。经常，我们在启动应用的时候发现系统需要的端口被别的程序占用，
linux安装单机版spark3.5.0 爱上雪茄大数据 JAVA知识 spark 大数据分布式
一、spark介绍是一种通用的大数据计算框架，正如传统大数据技术Hadoop的MapReduce、Hive引擎，以及Storm流式实时计算引擎等.Spark主要用于大数据的计算二、spark下载spark3.5.0三、spark环境变量配置exportJAVA_HOME=/usr/local/jdk1.8.0_391exportJRE_HOME=/usr/local/jdk1.8.0_391/jr
Hive中的NVL函数与COALESCE函数独影月下酌酒 Hadoop 大数据 hive hadoop 数据仓库
1.NVL函数1.1函数语法--nvl(value,default_value)-ReturnsdefaultvalueifvalueisnullelsereturnsvalueExample:>SELECTnvl(null,'bla')FROMsrcLIMIT1;blaFunctionclass:org.apache.hadoop.hive.ql.udf.generic.GenericUDFNv
hive库表占用空间大小的命令刀鋒偏冷 hive hadoop 数据仓库
1、查每个hive表占用的空间大小hdfsdfs-du-h/user/hive/warehouse2、按占用空间大小降序排列hdfsdfs-du/user/hive/warehouse/ipms.db|sort-nr3、查某一个分区占用空间大小（单位G)hadoopfs-ls/user/hive/warehouse/ipms.db/dw_ft_se_nt_u_gen_h/fp_rat=6/stat
Hive中常用函数 wm_concat & concat_ws & collect_set & sort_array总结 Lens5935 Hive 数据库数据分析 hive 大数据 sql 数据库 postgresql
concat_ws&collect_set:应用1:usereach_iduser_id1id1user_id1id2user_id2id1user_id2id2user_id2id3user_id3id1useridsuser_id1id1,id2user_id2id1,id2,id3user_id3id1selectdt,user_id,concat_ws(',',collect_set(ea
HIVE表中导入导出数据的几种方式 qq_37805784 hive 大数据数据仓库
一：往HIVE表中导入导出数据语法结构:[]带括号的表示可选择字段LOADDATA[LOCAL]INPATH‘filepath’[OVERWRITE]INTOTABLEtablename[PARTITION(partcol1=val1,partcol2=val2…)]各种参数说明：1-hive只对导入该表中的数据按照自己的方式处理，对于错误的数据不管，超出直接丢弃。2-Load操作只是单纯的复制/
Hive中的CONCAT、CONCAT_WS与COLLECT_SET函数独影月下酌酒大数据 Hadoop hive hadoop 数据仓库
1.CONCAT与CONCAT_WS函数1.1CONCAT函数--concat(str1,str2,...strN)-returnstheconcatenationofstr1,str2,...strNorconcat(bin1,bin2,...binN)-returnstheconcatenationofbytesinbinarydatabin1,bin2,...binNReturnsNULLi
03hive数仓安装与基础使用 daydayup9527 hadoop_hive 运维 hadoop
hiveHive概述Hive是基于Hadoop的一个数据仓库工具。可以将结构化的数据文件映射为一张表，并提供完整的sql查询功能，本质上还是一个文件底层是将sql语句转换为MapReduce任务进行运行本质上是一种大数据离线分析工具学习成本相当低，不用开发复杂的mapreduce应用，十分适合数据仓库的统计分析hive可以用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在hadoop
Hive函数 LAG 和 LEAD 使用示例公子乂 hive hadoop 数据仓库 sql 大数据
Hive函数LAG和LEAD使用示例在Hive中LAG和LEAD是用于访问前一个或后一个行的函数，通常与窗口函数一起使用。以下是它们的具体语法：1.LAG函数语法：LAG(expression[,offset[,default]])OVER(PARTITIONBY...ORDERBY...)expression:要访问前一个行的列或表达式。offset(可选):指定要访问的前一个行的偏移量，默认为
Apache Paimon 使用之Creating Catalogs 猫猫爱吃小鱼粮 Paimon apache hive hadoop
PaimonCatalog目前支持两种类型的metastores：filesystemmetastore(default)，在文件系统中存储元数据和表文件。hivemetastore，将metadata存储在Hivemetastore中。用户可以直接从Hive访问表。1.使用FilesystemMetastore创建CatalogFlink引擎FlinkSQL注册并使用名为my_catalog的P
Sqoop一些常用命令及参数大数据小同学
常用命令列举这里给大家列出来了一部分Sqoop操作时的常用参数，以供参考，需要深入学习的可以参看对应类的源代码。命令类说明importImportTool将数据导入到集群exportExportTool将集群数据导出codegenCodeGenTool获取数据库中某张表数据生成Java并打包Jarcreate-hive-tableCreateHiveTableTool创建Hive表evalEval
Spark从入门到精通29:Spark SQL：工作原理剖析以及性能优化勇于自信
SparkSQL工作原理剖析1.编写SQL语句只要是在数据库类型的技术里面，例如MySQL、Oracle等，包括现在大数据领域的数据仓库，例如Hive。它的基本的SQL执行的模型，都是类似的，首先都是要生成一条SQL语句执行计划。执行计划即从哪里查询，在哪个文件，从文件中查询哪些数据，此外，复杂的SQL还包括查询时是否对表中的数据进行过滤和筛选等等。2.UnresolvedLogicalPlan未
hive--去除特殊字符regexp_replace 韩家小志一些杂项 replace hive去特殊字符
文章目录regexp_replace`'\tabc\ndef\rhij'`→`'abcdefhij'``'\tabc\ndef\rhij'`→`'abcdefhij'`看一下其他的情况regexp_replace'\tabc\ndef\rhij'→'abcdefhij'selectregexp_replace('\tabc\ndef\rhij','\n|\t|\r|','');'abcdefhij
Hive--行转列/列转行韩家小志 #Hive函数 hive
行转列/列转行一、lateralview案例1：与explode连用案例2：与parse_url_tuple连用二、explode三、行列转换行转列多行转多列多行转单列列转行多列转多行单列转多行一、lateralview分类：视图功能：配合UDTF来使用,把某一行数据拆分成多行数据很多的UDTF不能将结果与源表进行关联，使用lateralview，可以将UDTF拆分的单个字段数据与原始表数据关联上
HiveSQL某天每个直播间最大在线人数 sofo2017 数据仓库技术体系 hive
一张表dwd_user_log有如下字段：1）直播间：live_id2）用户:userid3）时间戳:date_stamp4）登陆类型:entry_type(登入in和登出out)求某天每个直播间最大在线人数？selectlive_id,max(total_users)max_total_usersfrom(selectlive_id,userid,date_stamp,sum(ind)over(
Hive SQL 开发指南（三）优化及常见异常大数据_苡~ 003-数据开发 hive Hive优化数据倾斜 Hive常见异常 hive join
在大数据领域，HiveSQL是一种常用的查询语言，用于在Hadoop上进行数据分析和处理。为了确保代码的可读性、维护性和性能，制定一套规范化的HiveSQL开发规范至关重要。本文将介绍HiveSQL的基础知识，并提供一些规范化的开发指南，帮助您高效地编写HiveSQL查询。本系列分为HiveSQL开发指南（一）数据类型及函数HiveSQL开发指南（二）使用（DDL、DML，DQL）HiveSQL开
大数据开发（Hadoop面试真题-卷九） Key-Key 大数据 hadoop 面试
大数据开发（Hadoop面试真题）1、Hivecount(distinct)有几个reduce，海量数据会有什么问题？2、既然HBase底层数据是存储在HDFS上，为什么不直接使用HDFS，而还要用HBase?3、Sparkmapjoin的实现原理？4、Spark的stage如何划分？在源码中是怎么判断属于ShuffleMapStage或ResultStage的？5、SparkreduceByKe
Hive分组排序取topN的sql查询示例公子乂 hive sql hadoop 大数据数据仓库
Hive分组排序取topN的sql查询示例要在Hive中实现分组排序并取每组的前N条记录，可以使用ROW_NUMBER()窗口函数结合PARTITIONBY和ORDERBY子句。以下是一个示例SQL查询，用于选择每个部门中工资最高的前3名员工：SELECTdepartment,employee_id,employee_name,salaryFROM(SELECTdepartment,employe
归档模式个人精进成长营
1：归档日志文件在线日志——用于崩溃/实例恢复/介质恢复归档日志——用于介质恢复2：确认数据库是否为归档模式archiveloglist;--查看数据归档信息selectlog_modefromv$database;--查看数据库是否为归档模式3：归档模式和非归档模式的相互切换alterdatabasenoarchivelog;--数据库切换成非归档模式（MOUNT）alterdatabasear
hbase、hive、clickhouse对比 freshrookie hbase hive hadoop
概念架构hbasemaster存储元数据、regionServer实际控制表数据，存储单位是Region，底层数据存储使用HDFShive通过driver将sql分解成mapreduce任务元数据需要单独存储到一个关系型数据库，一般是mysql实际数据存储可以是外表，也可以是内表clickhouse单体架构分层类似mysql，集群状态下是多主，通过zookeeper通信数据存储看引擎，最重要的引擎
Mac 离线安装Qt5 熊明之 mac c++
如果使用brewinstallqt发生不明原因报错，可以尝试离线下载qt！！！1下载QT1.1.打开链接：https://download.qt.io/archive/qt/在这个链接上，可以看到不同版本的QT，我们选择稳定5.9/点开后，选择5.9.8版本，可以看到不同版本的QT，选择Mac本QTqt-opensource-mac-x64-5.9.8.dmg；下载后安装；1.2首次使用qt会出现
hive--字符串连接函数concat(),concat_ws() nuhao_ sql 数据库 hive hadoop 数据仓库
一、字符串连接函数：concat功能：将多个字符串连接成一个字符串语法:concat(stringA,stringB…)返回值:string说明：返回输入字符串连接后的结果，支持任意个输入字符串举例：hive>selectconcat('abc','def','gh');abcdefgh二、字符串连接函数-带分隔符：concat_ws功能：和concat()一样，将多个字符串连接成一个字符串，但是
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开

Hive--行转列/列转行

行转列/列转行

一、lateral view

案例1：与explode连用

案例2：与parse_url_tuple连用

二、explode

三、行列转换

行转列

多行转多列

多行转单列

列转行

多列转多行

单列转多行

你可能感兴趣的:(#,Hive函数,hive)