小强签名设计

大数据篇--Hive调优

文章目录

- - 一、表设计层面
  - - 1.关闭动态分区：
    - 2.开启分桶：
    - 3.采用合适的存储格式：
  - 二、参数调优
  - - 1.严格模式：
    - 2.Fetch Task功能：
    - 3.reduce个数控制：
    - 4.map join：
    - 5.skewjoin方案：
    - 6.group by导致的数据倾斜：
    - 7.调整切片数（Map任务数）：
    - 8.本地模式：
  - 三、语法层面调优
  - - 1.order by和sort by：
    - 2.cluster by和distribute by：
    - 3.执行计划Explain：
    - 4.where条件优化：
    - 5.union优化：
    - 6.count distinct优化：
  - 四、数据倾斜
  - - 1.表现：
    - 2.一些常见的：
    - 3.空值产生的数据倾斜：
    - 4.不同数据类型关联产生数据倾斜：

一、表设计层面

1.关闭动态分区：

动态分区插入数据，会产生大量的小文件，map数据会增加，同时namenode也需要存储更多元数据信息，检索更多的小文件。还有一个更加隐秘的问题，从A表导入数据到B表，AB俩表的分区列一样，如果这时候偷懒，插入B表开动态分区，hadoop会生成假的reduce个数，真实的reduce个数，也就是处理数据reduce节点和分区数一致，其他的reduce都是空跑。如果导入数据极大，redue个数很少，会产生严重的数据倾斜。解决办法：使用distribute by+静态分区。

静态分区是插入时对分区字段指定值，动态分区是插入时对分区字段不指定值；动态分区在数据量大于0时才会创建分区，静态分区的数据量为0时也会创建分区。动态分区可以通过下面的设置来打开：

set hive.exec.dynamic.partition=true; -- 是开启动态分区
set hive.exec.dynamic.partition.mode=nonstrict; -- 这个属性默认值是strict，就是要求分区字段必须有一个是静态的分区值，当前设置为nonstrict,那么可以全部动态分区

2.开启分桶：

分桶：按照用户创建表时指定的分桶字段进行hash散列多个文件。单个分区或者表中的数据量越来越大，当分区不能更细粒的划分数据时，所以会采用分桶技术将数据更细粒度的划分和管理。

获得更高的查询处理效率：桶为表加上了额外的结构，Hive 在处理有些查询时能利用这个结构。具体而言，连接两个在（包含连接列的）相同列上划分了桶的表，可以使用 Map 端连接（Map-side join）高效的实现。比如JOIN操作。对于JOIN操作两个表有一个相同的列，如果对这两个表都进行了桶操作。那么将保存相同列值的桶进行JOIN操作就可以，可以大大减少JOIN的数据量。

set hive.enforce.bucketing=true;
set hive.enforce.sorting=true;

3.采用合适的存储格式：

在HiveSQL的create table语句中，可以使用stored as ...指定表的存储格式。Hive表支持的存储格式有TextFile、SequenceFile、RCFile、Avro、ORC、Parquet等。
存储格式一般需要根据业务进行选择，在我们的实操中，绝大多数表都采用TextFile与Parquet两种存储格式之一。
TextFile是最简单的存储格式，它是纯文本记录，也是Hive的默认格式。虽然它的磁盘开销比较大，查询效率也低，但它更多地是作为跳板来使用。RCFile、ORC、Parquet等格式的表都不能由文件直接导入数据，必须由TextFile来做中转。
Parquet和ORC都是Apache旗下的开源列式存储格式。列式存储比起传统的行式存储更适合批量OLAP查询，并且也支持更好的压缩和编码。我们选择Parquet的原因主要是它支持Impala查询引擎，并且我们对update、delete和事务性操作需求很低。
这里就不展开讲它们的细节，可以参考各自的官网：
https://parquet.apache.org/
https://orc.apache.org/

二、参数调优

1.严格模式：

在hive里面可以通过严格模式防止用户执行那些可能产生意想不到的查询,从而保护hive的集群。在严格模式下，用户在运行如下query的时候会报错：

分区表的查询没有使用分区字段来限制即 where 中过滤字段不是分区字段
使用了 order by 但没有使用 limit 语句。（如果不使用 limit，会对查询结果进行全局排序，消耗时间长）
当用户写代码将表的别名写错的时候会引起笛卡尔积，例如
select * from origindb.promotion__campaign c JOIN origindb.promotion__campaignex ce ON c.id = c.id limit 1000;

-- 默认是非严格模式（nonstrict）
hive> set hive.mapred.mode;
hive.mapred.mode=nonstrict
-- 设置成严格模式后一定要加limit，否则会报错
hive> set hive.mapred.mode=strict;
hive> select * from emp order by empno desc;
FAILED: SemanticException 1:27 In strict mode, if ORDER BY is specified, LIMIT must also be specified. Error encountered near token 'empno'

2.Fetch Task功能：

某些 SELECT 查询可以转换为一个 FETCH 任务，从而最大限度地可以减少交互的延迟。在目前情况下，查询只能是单一数据源，不能有任何的子查询，不能有任何的聚合，去重，Lateral views 以及 Join。Fetch 任务是 Hive 中执行效率比较高的任务之一。直接遍历文件并输出结果，而不是启动 MapReduce 作业进行查询。对于简单的查询，如带有 LIMIT 语句的 SELECT * 查询，这会非常快(单位数秒级)。在这种情况下，Hive 可以通过执行 HDFS 操作来返回结果。

在hive-site.xml中有三个fetch task相关的值：hive.fetch.task.conversion，hive.fetch.task.conversion.threshold，hive.fetch.task.aggr

hive.fetch.task.conversion.threshold：在输入大小为多少以内的时候fetch task生效，从 Hive 0.13.0 版本到 Hive 0.13.1 版本起，默认值为-1（表示没有任何的限制），Hive 0.14.0 版本以及更高版本默认值改为 1073741824 byte(1G)。

<property>
  <name>hive.fetch.task.conversion.thresholdname>
  <value>1073741824value>
  <description>
    Input threshold for applying hive.fetch.task.conversion. If target table is native, input length
    is calculated by summation of file lengths. If it's not native, storage handler for the table
    can optionally implement org.apache.hadoop.hive.ql.metadata.InputEstimator interface.
  description>
property>

hive.fetch.task.aggr：对于没有 group by 的聚合查询，比如 select count(*) from src，这种最终都会在一个 reduce 中执行，像这种查询，可以把这个置为 true 将其转换为 fetch task，这可能会节约一些时间。

<property>
  <name>hive.fetch.task.aggrname>
  <value>truevalue>
  <description>
    Aggregation queries with no group-by clause (for example, select count(*) from src) execute
    final aggregations in single reduce task. If this is set true, Hive delegates final aggregation
    stage to fetch task, possibly decreasing the query time.
  description>
property>

hive.fetch.task.conversion：
(1) 直接在命令行中使用set命令进行设置：

hive> set hive.fetch.task.conversion=more;

(2) 使用hiveconf进行设置：

bin/hive --hiveconf hive.fetch.task.conversion=more

(3) 上面的两种方法都可以开启了 Fetch Task，但是都是临时起作用的；如果你想一直启用这个功能，可以在 ${HIVE_HOME}/conf/hive-site.xml 里面修改配置：

<property>
  <name>hive.fetch.task.conversionname>
  <value>morevalue>
  <description>
    Expects one of [none, minimal, more].
    Some select queries can be converted to single FETCH task minimizing latency.
    Currently the query should be single sourced not having any subquery and should not have
    any aggregations or distincts (which incurs RS), lateral views and joins.
    0. none : disable hive.fetch.task.conversion
    1. minimal : SELECT STAR, FILTER on partition columns, LIMIT only
    2. more    : SELECT, FILTER, LIMIT only (support TABLESAMPLE and virtual columns)
  description>
property>

可支持的选项有 none,minimal 和 more，从 Hive 0.10.0 版本到 Hive 0.13.1 版本起，默认值为 minimal，Hive 0.14.0 版本以及更高版本默认值改为 more：

none：禁用fetch task优化（在Hive 0.14.0版本中引入）
minimal：只在select *、使用分区列过滤、带有limit的语句上进行优化
more：在minimal的基础上更加强大了，select不仅仅可以是*，还可以单独选择几列，并且filter也不再局限于分区字段，同时支持虚拟列（别名）

3.reduce个数控制：

为什么要设置rereduce的个数？

reduce数量很大就可能生成很多小文件。
reduce数量很少就可能导致作业耗费时间长，最终有可能任务跑不出来。

参考官网：https://cwiki.apache.org/confluence/display/Hive/Configuration+Properties

hive> set hive.exec.reducers.bytes.per.reducer;
hive.exec.reducers.bytes.per.reducer=256000000
hive> set hive.exec.reducers.max;
hive.exec.reducers.max=1009; -- 默认是它自己根据相应公式算的，具体可翻阅源码
hive> set mapred.reduce.tasks = 3; -- 设置reduce数量

在Spark中相当于是要设置partition的数量：
Partition数量太少：太少的影响显而易见，就是资源不能充分利用，例如local模式下，有16core，但是Partition数量仅为8的话，有一半的core没利用到。
Partition数量太多：太多，资源利用没什么问题，但是导致task过多，task的序列化和传输的时间开销增大。
那么多少的partition数是合适的呢，这里我们参考spark doc给出的建议，Typically you want 2-4 partitions for each CPU in your cluster。（Spark 官网建议的 Task 的设置原则是：设置 Task 数目为num-executors * executor-cores的2~3倍较为合适。）
也可以参考：如何管理Spark的分区

4.map join：

参考官网：
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Joins
https://cwiki.apache.org/confluence/display/Hive/Configuration+Properties中的hive.auto.convert.join参数

Map Join：
优点：没有shuffle/Reduce过程，效率提高
缺点：由于小表都加载到内存当中，读内存的要求提高了
原理执行流程可参考：
Hive Map Join 原理
http://lxw1234.com/archives/2015/06/313.htm

Hive0.11之前，默认的join方式是reduce端join，即Common Join=Shuffle join=Reduce join(hive.auto.convert.join默认为false)，其原理是map的输出数据通过hash进行partition，然后shuffle至对应的reduce端执行join。如果join key分布不均匀，则会造成一定的数据倾斜，比较明显的现象就是某一个reduce会一直运行在99%，在join运行完毕后，可以通过job的counter看到，reduce处理的数据量相差很大。
join中还有一个方式是map join，即在map端进行join，其原理是broadcast join，即把比较小的表直接放到内存中去，然后再对比较大的表进行Map操作，join就会在map操作的时候，每当扫描一个大的table中的数据，就要去查看小表的数据，哪条与之相符，继而进行连接。这种方式比较适合表中有一个小表的情况，hive是rbo的方法来执行操作的，所以需要把小表放在前面，不过也可以手动指定hint，比如/*+ mapjoin(a)*/。

Hive 0.11之后，在表的大小符合设置时（hive.auto.convert.join.noconditionaltask=true，hive.auto.convert.join.noconditionaltask.size=10000，hive.mapjoin.smalltable.filesize=25000000，即25M），默认会把join转换为map join（让hive.ignore.mapjoin.hint为true，hive.auto.convert.join为true），不过hive0.11的map join bug比较多，可以通过默认关闭map join convert，在需要时再设置hint：hive.auto.convert.join=false，hive.ignore.mapjoin.hint=false

如果不指定MapJoin或者不符合MapJoin的条件，那么Hive解析器会将Join操作转换成Common Join，即在Reduce阶段完成join，整个过程包含Map、Shuffle、Reduce阶段。

Map阶段：读取源表的数据，Map输出时候以Join on条件中的列为key，如果Join有多个关联键，则以这些关联键的组合作为key；Map输出的value为join之后所关心的(select或者where中需要用到的)列；同时在value中还会包含表的Tag信息，用于标明此value对应哪个表；按照key进行排序。
Shuffle阶段：根据key的值进行hash，并将key/value按照hash值推送至不同的reduce中，这样确保两个表中相同的key位于同一个reduce中。
Reduce阶段：根据key的值完成join操作，期间通过Tag来识别不同表中的数据。

扩展：小表不小不大，怎么用 map join 解决倾斜问题。
使用 map join 解决小表(记录数少)关联大表的数据倾斜问题，这个方法使用的频率非常高，但如果小表很大，大到map join会出现bug或异常，这时就需要特别的处理。以下例子：

select 
	* 
from 
	log a
left outer join 
	users b
on 
	a.user_id = b.user_id;

users 表有 600w+ 的记录，把 users 分发到所有的 map 上也是个不小的开销，而且 map join 不支持这么大的小表。如果用普通的 join，又会碰到数据倾斜的问题。解决方法：

select /*+mapjoin(x)*/* from log a
  left outer join (
    select  /*+mapjoin(c)*/d.*
      from ( select distinct user_id from log ) c
      join users d
      on c.user_id = d.user_id
    ) x
  on a.user_id = x.user_id;

假如，log里user_id有上百万个，这就又回到原来map join问题。所幸，每日的会员uv不会太多，有交易的会员不会太多，有点击的会员不会太多，有佣金的会员不会太多等等。所以这个方法能解决很多场景下的数据倾斜问题。

5.skewjoin方案：

参考：
https://www.cda.cn/discuss/post/details/5ef4b5dae76c715bf35703e4
https://www.cnblogs.com/aukle/p/3233704.html

在Hive的数据处理过程中，由于join造成的倾斜，常见情况是不能做map join的两个表(能做map join的话基本上可以避免倾斜)，其中一个是行为表，另一个应该是属性表。比如我们有三个表，一个用户属性表users，一个商品属性表items，还有一个用户对商品的操作行为表日志表logs。假设现在需要将行为表关联用户表：select * from logs l join users u on l.user_id = u.user_id;
其中logs表里面会有一个特殊用户user_id = 0，代表未登录用户，假如这种用户占了相当的比例，那么个别reduce会收到比其他reduce多得多的数据，因为它要接收所有user_id = 0的记录进行处理，使得其处理效果会非常差，其他reduce都跑完很久了它还在运行。
hive给出的解决方案叫skew join，其原理把这种user_id = 0的特殊值先不在reduce端计算掉，而是先写入hdfs，然后启动一轮map join专门做这个特殊值的计算，期望能提高计算这部分值的处理速度。当然你要告诉hive这个join是个skew join，即：set hive.optimize.skewjoin = true;
还有要告诉hive如何判断特殊值，根据set hive.skewjoin.key = skew_key_threshold （default = 100000）设置的数量hive可以知道，比如默认值是100000，那么超过100000条记录的值就是特殊值。所以使用这个参数控制倾斜的阈值，如果超过这个值，新的值会发送给那些还没有达到的reduce，一般可以设置成你（处理的总记录数/reduce个数）的2-4倍都可以接受。倾斜是经常会存在的，一般select 的层数超过2层，翻译成执行计划多于3个以上的mapreduce job 都很容易产生倾斜，建议每次运行比较复杂的sql 之前都可以设一下这个参数. 如果你不知道设置多少，可以就按官方默认的1个reduce 只处理1G 的算法，那么 skew_key_threshold = 1G/平均行长. 或者默认直接设成250000000 (差不多算平均行长4个字节)。
其他相关参数：hive.skewjoin.mapjoin.map.tasks = <用于处理skew join的map join 的最大数量> (defaul : 10000)，hive.skewjoin.mapjoin.min.split=33554432（通过指定最小split的大小，执行细粒度的控制）
skew join的流程可以用下图描述：

6.group by导致的数据倾斜：

原因：group by 维度过小，某值的数量过多。处理某值的reduce灰常耗时。

set hive.map.aggr=true;：Map 端部分聚合，相当于Combiner
set hive.groupby.skewindata=true;：有数据倾斜的时候进行负载均衡，当选项设定为 true，生成的查询计划会有两个 MR Job。第一个 MR Job 中，Map 的输出结果集合会随机分布到 Reduce 中，每个 Reduce 做部分聚合操作，并输出结果，这样处理的结果是相同的 Group By Key 有可能被分发到不同的 Reduce 中，从而达到负载均衡的目的；第二个 MR Job 再根据预处理的数据结果按照 Group By Key 分布到 Reduce 中（这个过程可以保证相同的 Group By Key 被分布到同一个 Reduce 中），最后完成最终的聚合操作。

7.调整切片数（Map任务数）：

Hive底层自动对小文件做了优化，用了CombineTextInputFormat，将多个小文件切片合成一个切片。合成完之后的切片大小，如果大于mapred.max.split.size 的大小，就会生成一个新的切片。mapred.max.split.size 默认是128MB，set mapred.max.split.size=134217728（128MB），对于切片数（MapTask）数量的调整，要根据实际业务来定，比如一个100MB的文件，假设有1千万条数据，此时可以调成10个MapTask，则每个MapTask处理1百万条数据。

这个调优相当于是解决小文件的问题，可参考我的另一篇文章第四章中的第二小节：大数据篇–小文件

上图是InputFormat的派生子类关系图：

8.本地模式：

Hive也可以不将任务提交到集群进行运算，而是直接在一台节点上处理。因为消除了提交到集群的overhead，所以比较适合数据量很小，且逻辑不复杂的任务。设置hive.exec.mode.local.auto为true可以开启本地模式。但任务的输入数据总量必须小于hive.exec.mode.local.auto.inputbytes.max（默认值128MB），且mapper数必须小于hive.exec.mode.local.auto.tasks.max（默认值4），reducer数必须为0或1，才会真正用本地模式执行。

三、语法层面调优

1.order by和sort by：

参考hive官网：https://cwiki.apache.org/confluence/display/Hive/LanguageManual+SortBy

Order by只会产生一个reducer，全局排序。
Sort by只能保证每个reduce内部是有序的，并不能保证全局有序。

hive> set mapred.reduce.tasks = 3;
hive> insert overwrite local directory '/home/hadoop/hive_tmp/sort' select * from emp sort by empno desc;

2.cluster by和distribute by：

distribute by：按照指定的字段把数据分散到不同的reduce里面去。
cluster by：如果sort by和distribute by中所有的列相同，可以缩写为cluster by以便同时指定两者所用的列。

hive> insert overwrite local directory '/home/hadoop/hive_tmp/distribute' select * from emp distribute by length(ename) sort by empno;

3.执行计划Explain：

我们都知道，hive在执行的时候会把所对应的SQL语句都会转换成mapreduce代码执行，但是具体的MR执行信息我们怎样才能看出来呢？这里就用到了explain的关键字，他可详细的表示出在执行所对应的语句所对应的MR代码。 explain会把查询语句转化成stage组成的序列，主要由三方面组成：

查询的抽象语法树
plane中各个stage的依赖情况
每个阶段的具体描述：描述具体来说就是显示出对应的操作算子和与之操作的对应的数据，例如查询算子，filter算子，fetch算子等等。

参考官网：https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Explain

查看下面这条语句的执行计划：
hive (default)> explain select * from emp;

hive (default)> explain select deptno, avg(sal) avg_sal from emp group by deptno;

4.where条件优化：

优化前：select m.cid,u.id from order m join customer u on m.cid =u.id where m.dt='20180808';
优化后(where条件在map端执行而不是在reduce端执行）：select m.cid,u.id from (select * from order where dt='20180818') m join customer u on m.cid=u.id;

注意：hive在做join时小表写在前面。

5.union优化：

尽量不要使用union（union会去掉重复的记录）而是使用 union all 然后再用 group by 去重。

6.count distinct优化：

数据量小的时候无所谓，数据量大的情况下，由于 COUNT DISTINCT 操作需要用一个 Reduce Task 来完成，这一个 Reduce 需要处理的数据量太大，就会导致整个 Job 很难完成，一般 COUNT DISTINCT 使用先 GROUP BY 再 COUNT 的方式替换：

SELECT day,
COUNT(DISTINCT id) AS uv
FROM users;

可以转换成：

SELECT day,
COUNT(id) AS uv
FROM (SELECT day,id FROM users GROUP BY day,id) a;

注意：count 操作是全局计数，在底层转换 MRJob 时用于计数的分区（reduce Task）只有一个。

-- 优化前
Select a,sum(b),count(distinct c),count(distinct d) from test group by a
-- 优化后的语句
Select a ,sum(b),count（c）,count(d) from (
				Select a,b,null c,null d from test
				Union all
				Select a,0 b,c,null d from test group by a,c
				Union all
				Select a,0,null c,d from test group by a,d
)

四、数据倾斜

1.表现：

任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce 子任务未完成。因为其处理的数据量和其他 reduce 差异过大。单一 reduce 的记录数与平均记录数差异过大，通常可能达到3倍甚至更多。最长时长远大于平均时长。

2.一些常见的：

关键词	情形	后果	解决
大小表Join	其中一个表较小，但是 key 集中	分发到某一个或几个 Reduce 上的数据远高于平均值	参考上面第二大节的第4小节
大表Join大表	两个表都较大，不能支持 map join，其中一个表中数据量某一类值特别多	分配到该值的 reducer，耗时较长	参考上面第二大节的第5小节
group by	group by 维度过小，某值的数量过多	处理某值的 reduce 非常耗时	参考上面第二大节的第6小节
count(distinct)	数据量大的情况下	用一个 Reduce Task 来完成，就会导致整个 Job 很难完成	参考上面第三大节的第6小节

3.空值产生的数据倾斜：

场景：如日志中，常会有信息丢失的问题，比如日志中的 user_id，如果取其中的 user_id 和用户表中的 user_id 关联，会碰到数据倾斜的问题。

解决方法1： user_id为空的不参与关联

select * from log a
  join users b
  on a.user_id is not null
  and a.user_id = b.user_id
union all
select * from log a
  where a.user_id is null;

解决方法2 ：赋与空值新的key值

select *
  from log a
  left outer join users b
  on case when a.user_id is null then concat(‘hive’,rand() ) else a.user_id end = b.user_id;

结论：方法2比方法1效率更好，不但 io 少了，而且作业数也少了。解决方法1中 log 读取两次，jobs 是2。解决方法2 job 数是1 。这个优化适合无效 id (比如 -99 , ’’, null 等) 产生的倾斜问题。把空值的 key 变成一个字符串加上随机数，就能把倾斜的数据分到不同的 reduce上 ,解决数据倾斜问题。

4.不同数据类型关联产生数据倾斜：

场景：用户表中 user_id 字段为 int，log 表中 user_id 字段既有 string 类型也有 int 类型。当按照 user_id 进行两个表的 Join 操作时，默认的 Hash 操作会按 int 型的 id 来进行分配，这样会导致所有 string 类型 id 的记录都分配到一个Reducer中。

解决方法：把数字类型转换成字符串类型

select * from users a
  left outer join logs b
  on a.usr_id = cast(b.user_id as string)

参考：https://my.oschina.net/osenlin/blog/1603056

你可能感兴趣的:(大数据面试,hive,调优)

Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
【经典面试题】【JVM与性能调优】垃圾回收算法（标记-清除算法/复制算法/标记-整理算法/CMS/G1/ZGC）本本本添哥归档 -Inbox1 001 -基础开发能力面试题目汇总 jvm 算法
JVM自动管理内存，当对象不再被引用时，垃圾回收器（GarbageCollector）会自动释放这些对象占用的内存。标记-清除算法（Mark-Sweep）：标记垃圾再清除，会产生碎片。复制算法（Copying）：将存活对象复制到新区域，适合新生代，无碎片但浪费空间。标记-整理算法（Mark-Compact）：标记后将存活对象移到一端，清除另一端，适合老年代。分代收集算法（GenerationalC
【服务器知识】nginx配置ipv6支持问道飞鱼服务器相关服务器 nginx 网络 ipv6
nginx配置ipv6支持Nginx全面支持IPv6配置指南一、基础IPv6配置1.启用IPv6监听2.IPv6地址格式说明二、高级IPv6配置1.双栈配置优化2.IPv6访问控制3.IPv6反向代理三、SSL/TLS配置1.IPv6SSL证书配置2.HSTS包含IPv6四、性能优化1.内核参数调优2.Nginx调优参数五、安全加固1.IPv6DDoS防护2.防止地址欺骗六、IPv6测试与诊断1.
Ubuntu安装LAMP L_h1 测试 ubuntu linux
在安装vim时遇到了一个问题：E:无法获得锁/var/lib/dpkg/lock-frontend-open(11:资源暂时不可用)E:无法获取dpkg前端锁(/var/lib/dpkg/lock-frontend)，是否有其他进程正占用它？解决办法：强制解锁sudorm/var/lib/dpkg/lock-frontendsudorm/var/cache/apt/archives/locksud
Python 网络科学（三）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/3df7c5feb0bf40d7b9d88197a04b0b37译者：飞龙协议：CCBY-NC-SA4.0第八章：自我中心网络分析前一章内容非常丰富，我们学习了如何可视化和分析整个网络。相比之下，本章应该会感觉更简单，内容也会少得多。在之前的章节中，我们学习了如何获取和创建网络数据，如何从网络数据构建图形，如何清理图形数据，以及如何做一些有趣的事情
精通 Tableau 2023（四）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/dd6efaef313fee7252226d3af4a0b9fd译者：飞龙协议：CCBY-NC-SA4.0第十三章：提升性能一旦人们熟悉了Tableau的功能，他们很快就会遇到另一种类型的问题：性能。你们可能都曾经在屏幕上盯着加载数据或执行查询的字样发呆。但别担心，我们有办法！如果设计得当，Tableau仪表盘即使处理大量数据也能表现得非常好。本章
Hive使用必知必会系列王知无(import_bigdata) Hive系统性学习专栏 hive big data hdfs
一、Hive的几种数据模型内部表(Table将数据保存到Hive自己的数据仓库目录中：/usr/hive/warehouse)外部表(ExternalTable相对于内部表，数据不在自己的数据仓库中，只保存数据的元信息)分区表(PartitionTable将数据按照设定的条件分开存储，提高查询效率，分区----->目录)桶表(BucketTable本质上也是一种分区表，类似hash分区桶---->
Consul 与 Hive：云原生数据仓库集成 AI云原生与云计算技术学院 AI云原生与云计算数据仓库 consul hive ai
Consul与Hive：云原生数据仓库集成关键词：Consul、Hive、云原生、数据仓库集成、服务发现摘要：本文深入探讨了Consul与Hive在云原生环境下的数据仓库集成。首先介绍了集成的背景和相关概念，包括Consul的服务发现机制和Hive作为数据仓库的特点。接着详细阐述了核心概念及联系，通过文本示意图和Mermaid流程图展示其架构。对集成所涉及的核心算法原理进行了讲解，并给出Pytho
Hive详解
一：Hive的历史价值1，Hive是Hadoop上的KillerApplication，Hive是Hadoop上的数据仓库，Hive同时兼具有数据仓库中的存储引擎和查询引擎的作用；而SparkSQL是一个更加出色和高级的查询引擎，所以在现在企业级应用中SparkSQL+Hive成为了业界使用大数据最为高效和流行的趋势。2，Hive是Facebook的推出，主要是为了让不动Java代码编程的人员也能
Hive与Hudi集成：增量大数据处理方案 AI大数据智能洞察大数据与AI人工智能大数据AI应用 hive hadoop 数据仓库 ai
Hive与Hudi集成：增量大数据处理方案关键词：Hive、Hudi、增量大数据处理、数据集成、数据湖摘要：本文主要探讨了Hive与Hudi集成的增量大数据处理方案。我们将深入了解Hive和Hudi的核心概念，剖析它们之间的关系，详细阐述集成的算法原理与操作步骤，通过实际项目案例展示如何进行开发环境搭建、代码实现与解读。同时，会介绍该集成方案的实际应用场景、相关工具和资源，探讨未来发展趋势与挑战。
Java高并发解决方案：线程池ThreadPoolExecutor详解 AI应用架构探索者 AI人工智能与大数据应用开发 AI实战 java python 开发语言 ai
Java高并发解决方案：线程池ThreadPoolExecutor详解关键词：Java高并发、线程池、ThreadPoolExecutor、阻塞队列、拒绝策略、线程复用、任务调度摘要：在Java高并发场景中，线程池是解决线程频繁创建/销毁、资源浪费和线程管理混乱的“瑞士军刀”。本文将以“餐厅服务团队”为类比，用小学生都能听懂的语言，从线程池的核心参数、工作流程、实战配置到调优技巧，全面解析Thre
Mac电脑安装了Charles，证书已经信任，电脑还是没网？如何解决 bug菌¹ 全栈Bug调优(实战版)#CSDN问答解惑(全栈版)macos
本文收录于《全栈Bug调优(实战版)》专栏，主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！问题描述Mac电脑安装了Charles，证书已经信任，电脑还是没网，如下解决？？解决方案Mac电脑安装了Charles后，出现证书已经信任但电脑仍然无法上网的问题，通常涉
【20年架构师韩艳威整理】CentOS Stream10磁盘管理第4章韩公子的Linux大集市 Bash入门 centos linux 运维
文章目录优化细化1：磁盘识别与扫描（增强版）优化细化2：GPT分区高级操作优化细化3：文件系统优化参数优化细化4：LVM元数据管理优化细化5：LVM高级扩容技巧优化细化6：LVM快照管理优化细化7：LVM精简配置优化细化8：故障处理与恢复优化细化9：性能监控与调优优化细化10：安全与权限管理终极操作对比表：普通分区vsLVM灾难恢复检查清单以下是对CentOSStream10中BashShell磁
【自动化运维神器Ansible】Ansible常用模块之archive模块详解 IT成长日记 Ansible自动化运维指南自动化运维技术探索运维自动化 ansible archive 常用模块
目录1Ansiblearchive模块概述1.1archive模块的核心功能1.2为什么需要archive模块2archive模块工作原理3archive模块参数详解3.1必需参数：path3.2常用可选参数3.2.1dest3.2.2format3.2.3exclude3.3高级参数3.3.1remove3.3.2owner/group/mode4archive模块使用场景与示例4.1基础使用场
Hive建表时开启事务机制导致insert失败: This command is not allowed on an ACID table.. with a non-ACID transaction 智海观潮大数据 Hive hive 大数据
建表语句：createtableA(table_codestring,data_dtstring,update_dtstring)clusteredby(table_code)into1bucketsrowformatdelimitedfieldsterminatedby'\033'storedasorc--orc格式tablproperties('transactional'='true');执
面向现代数据湖仓的开放表格式对比分析：Iceberg、Hudi、Delta Lake与Paimon piekill 大数据平台大数据 spark flink big data 数据仓库
文章目录第一章数据湖的演进：从存储到事务型平台1.1前湖仓时代：ApacheHive的局限性1.2湖仓一体的范式转移第二章架构深度剖析2.1ApacheIceberg：以元数据为中心的设计2.2ApacheHudi：流式优先、时间轴驱动的架构2.3DeltaLake：以事务日志为唯一真相源2.4ApachePaimon：面向实时湖仓的LSM树架构第三章核心能力对比分析3.1事务性与并发控制3.2数
【自动化运维神器Ansible】Ansible常用模块之unarchive模块详解
目录1unarchive模块概述1.1unarchive模块的核心价值2unarchive模块工作原理3unarchive模块参数详解3.1源文件相关参数3.1.1src3.1.2remote_src3.2目标路径参数3.2.1dest3.2.2extra_opts3.3高级控制参数3.3.1keep_newer3.3.2validate_certs4unarchive模块使用场景与示例4.1基础
RK3568笔记九十一：QT环境搭建殷忆枫 RK3568学习笔记笔记
若该文为原创文章，转载请注明原文出处。记录按照正点原子给的手册搭建QT环境参考《09【正点原子】ATK-DLRK3568_Qt开发环境搭建V1.2.pdf》一、安装1、下载https://mirrors.sau.edu.cn/qt/archive/online_installers/4.6/qt-unified-linux-x64-4.6.0-online.run2、赋予可执行权限chmod+xq
从零搭建Squid代理服务器：完整配置指南爱睡觉的圈圈代理服务 tcp/ip 网络协议网络
目录引言Squid代理服务器概述系统环境准备Squid安装流程核心配置详解代理服务器架构图高级配置实战安全加固配置性能优化调优监控与维护常见问题排查总结引言作为一名运维工程师，我经常需要为公司搭建各种网络服务。其中，代理服务器是企业网络架构中不可或缺的一环。今天想和大家分享一下如何从零开始搭建一个高性能、安全可靠的Squid代理服务器。在我多年的实践中，Squid一直是我的首选代理服务器解决方案。
如何在spring cloud项目中引入用python代码写的数据可视化展示页面，并在前端页面进行展示？【附相关源码，完整的代码实现（Python + Java + 前端）】 bug菌¹ spring cloud python 信息可视化数据可视化展示页面前端页面 bug菌问答团队
本文收录于《全栈Bug调优(实战版)》专栏，该专栏专注于分享我在真实项目开发中遇到的各类疑难Bug及其深层成因，并系统提供高效、可复现的解决思路和实操方案。无论你是刚入行的新手开发者，还是拥有多年项目经验的资深工程师，本专栏都将为你提供一条系统化、高质量的问题排查与优化路径，助力你加速成长，攻克技术壁垒，迈向技术价值最大化与职业发展的更高峰！特别说明：文中部分技术问题来源于真实生产环境及网络公
Python与机器学习库Scikit-learn进阶 master_chenchengg python python Python python开发 IT
Python与机器学习库Scikit-learn进阶Scikit-learn进阶之旅：从新手到高手的必经之路为什么选择Scikit-learn？安装与环境设置特征工程的艺术：打造更强大的预测模型数据清洗特征构造模型调优秘籍：网格搜索与交叉验证的最佳实践网格搜索交叉验证集成学习的魅力：提升模型性能的组合拳随机森林梯度提升机堆叠实战案例解析：使用Scikit-learn解决真实世界问题数据准备模型训练
MySQL 监控与性能调优实战指南：从入门到精通 CarlowZJ AI应用落地涉及的数据库 mysql 数据库监控与性能调优实战指南从入门到精通
目录一、MySQL监控的核心概念与体系架构（一）监控的重要性与目标（二）构建全面的监控指标体系（三）MySQL内置监控工具详解与实战（四）外部监控工具深度集成与应用二、性能调优策略：从基础到高级的全方位实战技术（一）配置参数优化：挖掘MySQL内置潜力（二）SQL优化：从源头解决性能瓶颈（三）架构调优：硬件资源的合理调配（四）自动化调优工具：迈向智能化运维三、实战案例：高并发电商秒杀场景下的监控与
MyBatis中#{}与${}的实战避坑指南
MyBatis在持久层框架中占据举足轻重的地位，其映射文件中的两种参数占位符——#{}与${}——常常令初学者困惑，也令资深开发者反复斟酌。笔者在日常代码审计与性能调优过程中，屡次遇到因二者混用而导致的生产事故，因此决定撰写一篇技术博客，结合真实项目片段，系统梳理二者的使用差异、安全边界与工程落地细节。全文约三千字，力求言必有据，例证皆来自可运行的源码仓库，读者可直接复现并验证。在MyBatis的
Java全栈面试实战：从JVM到AI的技术演进之路
Java全栈面试实战：从JVM到AI的技术演进之路面试现场：大厂技术终面室面试官：谢飞机同学，今天我们将从底层原理到架构设计，全面考察你的Java技术栈掌握程度。请真实展示你的技术积累。谢飞机：（自信满满）面试官好！Java开发6年，从JVM调优到微服务架构，从数据库优化到AI集成，全栈技术无死角！第一轮：Java底层与性能优化面试官：请详细说明JVM内存区域划分，以及G1垃圾收集器的工作原理和适
Java游戏后端性能革命：从卡顿到丝滑的七大武器墨夶 Java学习资料 java 游戏开发语言
在游戏后端服务中，Java凭借其跨平台能力、成熟的生态、强大的并发模型，成为构建高性能游戏服务器的首选语言。然而，随着玩家规模的指数级增长，传统单体架构逐渐暴露延迟高、扩展性差、维护困难等痛点。本文将通过JVM调优、数据库深度优化、微服务架构设计、并发模型革新四大维度，结合真实游戏场景代码示例，揭示如何用Java构建百万级并发、毫秒级响应的游戏后端系统。一、JVM调优：从内存管理到GC停顿控制1.
C# ML.NET回归模型：用代码预测未来的“魔法”！墨夶 C#学习资料 c#.net 回归
**预测未来？不，是让数据替你说话！**想象一下：你坐在办公室里，老板突然问：“下个月的销售额能到多少？”你盯着Excel表格，头大如斗，公式写了一行又一行，结果还是不准！客户问：“我们产品价格怎么定最合适？”你却只能靠“感觉”回答！ML.NET回归模型就是你的“神兵利器”！它能：✅预测数值型目标：销售额、房价、车费……统统拿下！✅自动调优模型：不用手动调参，AI帮你选最优方案！✅无缝集成C#：不
在python中安装geohash库
pip安装使用镜像网站安装pipinstall-iGeohashhttp://mirrors.aliyun.com/pypi/simple报错：CannotdeterminearchiveformatofC:\Users\Zz\AppData\Local\Temp\pip-req-build-t35bzb_f解决办法：重新安装，添加信任pipinstall-ihttps://pypi.tuna.t
【RH134 问答题】第 5 章调优系统性能却道海棠 linux 运维
目录系统管理员可以使用哪个命令来更改tuned守护进程的设置？nice值是什么？如何使用top和ps命令查看nice级别？使用nice命令启动进程时，进程的默认值是多少？如何更改现有进程的nice级别？系统管理员可以使用哪个命令来更改tuned守护进程的设置？系统管理员可以使用tuned-adm命令来更改和管理tuned守护进程的设置。nice值是什么？nice值是Linux系统中用来控制进程优先
交换两个数组使两个数组和的差最小橙姜
https://www.cnblogs.com/nanduo/archive/2009/06/29/1513035.html
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul