Hive的动态分区与静态分区(区别及详解)

静态分区与动态分区的区别:

1、静态分区

2、动态分区


静态分区与动态分区的区别:

  • 静态分区是先把分区表创好,然后手动把数据导入到对应的分区里面去。
  • 静态分区实在编译期间指定分区名
  • 静态分区支持load、insert两种插入方式。
  • 静态分区是用于分区少,分区名可以明确的数据。

  • 动态分区是有一份数据集(2015-2022年的),按照数据集的字段给动态的生成分区。
  • 动态分区实在SQL执行的时候确定的。
  • 动态分区前需打开:set hive.exec.dynamic.partition.mode=nonstrict;
  • 动态分区只能用insert方式。
  • 动态分区通过普通表选出的字段包含分区字段,分区字段放在最后多个分区字段按照分区顺序放置。
    • 比如 [订单编号,订单创建时间,订单详情编号,订单价格,订单配送员...]
    • 订单创建时间(2021-11-12 12:22:49)把这个字段作为分区的字段。2021-11 这个作为分区条件。

面试题:什么时候使用静态分区,什么时候使用动态分区?

你可能感兴趣的:(Hadoop,hive,大数据,hadoop)