大数据技术学习框架(更新中......)

Hadoop相关

  • HDFS分布式文件系统
  • MR(MapReduce)离线数据处理
    • MR-图解
  • YARN集群资源管理

ZooKeeper

  • ZooKeeper分布式协调框架

Hive相关

  • Hive-01之数仓、架构、数据类型、DDL、内外部表
  • Hive-02之分桶表、数据导入导出、静动态分区、查询、排序、hiveserver2
  • Hive-03之传参、常用函数、explode、lateral view、行专列、列转行、UDF
  • Hive-04之存储格式、SerDe、企业级调优
  • Hive-05之查询 分组、排序、case when、 什么情况下Hive可以避免进行MapReduce
  • Hive-06之函数 聚合Cube、Rollup、窗口函数
  • Hive-07之企业级调优
  • Hive-08之数据仓库之建模、分析
  • Hive-09之主流文件存储格式对比
  • Hive-10之数据倾斜处理办法

Spark核心相关

  • Spark核心之01:架构部署、sparkshell、程序模板
  • Spark核心之02:RDD、算子分类、常用算子
    • Spark核心之02:常用算子详解
  • Spark核心之03写mysql、写HBase、RDD宽窄依赖、DAG、缓存、Checkpoint
  • Spark核心之04:spark程序运行架构流程、共享变量(广播变量和累加器)、程序序列化问题
  • Spark核心之05:sparkOnYarn、资源参数、调度模式、资源分配策略、shuffle机制??
  • Spark核心之06:知识点梳理

你可能感兴趣的:(大数据技术学习,大数据,学习)