大数据面试通关手册 | Hive面试题之4万字基础调优面试小总结

 

本文基本涵盖以下内容:

  • 一、基于Hadoop的数据仓库Hive基础知识

  • 二、HiveSQL语法

  • 三、Hive性能优化

  • 四、Hive性能优化之数据倾斜专题

  • 五、HiveSQL优化十二板斧

  • 六、Hive面试题(一)

  • 七、Hive/Hadoop高频面试点集合(二)

基于Hadoop的数据仓库Hive基础知识

Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理,提供了类似于SQL语言的查询语言–HiveQL,可通过HQL语句实现简单的MR统计,Hive将HQL语句转换成MR任务进行执行。

一、概述

1.1 数据仓库概念

数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile

你可能感兴趣的:(大数据面试通关手册,数据仓库,数据库,scipy,lighttpd,relativelayout)