wapysun

MySQL 查询优化器（转自Popgo的博客）

这篇描述MySQL查询优化器的工作原理。MySQL查询优化器主要为执行的查询决断最有效的路线（routine，走向）。

一。源代码和概念

这部分讨论优化器关键概念，术语，及在MySQL源代码怎么对应的。

1.定义

狭义定义：优化器，就是DBMS为查询时决断要往哪种执行路径的一系列路线。

MySQL是经常调整查询的路线，所以你得把这篇描述的逻辑和在源代码里的做比较。为了使比较容易些，这里会包含相关文件和路径的注解，例如源代码/sql/sql_select.cc，optimize_cond()函数。

当一个查询被转成另一种查询时，其结果是一样的，就会发生语句转化。如下这个查询

SELECT...WHERE 5 = a

就会被转化成为

SELECT... WHEREa = 5

最明显的语句转化是少的，有些语句转化，是为了更快的执行。

2.优化器源代码

如下伪代码显示了/sql/sql_select.cc中handle_select()函数的逻辑结构。（源代码/sql/sql_select.cc处理SQL查询）

handle_select()
mysql_select()
JOIN::prepare()
setup_fields()
JOIN::optimize() /* optimizerisfromhere... */
optimize_cond()
opt_sum_query()
make_join_statistics()
get_quick_record_count()
choose_plan()
/* Findthebestwaytoaccesstables */
/* asspecifiedbytheuser. */
optimize_straight_join()
best_access_path()
/* Finda(sub-)optimalplanamongallorsubset */
/* ofallpossiblequeryplanswheretheuser */
/* controlstheexhaustivenessofthesearch. */
greedy_search()
best_extension_by_limited_search()
best_access_path()
/* Performanexhaustivesearchforanoptimalplan */
find_best()
make_join_select() /* ...tohere */
JOIN::exec()

缩进行显示了哪个函数调用哪个函数，如handle_select()函数调用mysql_select()函数，mysql_select()函数会调用JOIN::prepare()、JOIN::optimize()、JOIN::exec()，以及类推。mysql_select()函数的第一部分是调用JOIN::prepare()，此函数用来上下文分析、元数据建立和一些语句转化。查询优化器函数JOIN::optimize()和其所有优化处理中的子路线。当执行完JOIN::optimize()函数后，JOIN::exec()接管并完成JOIN::optimize()函数优化决断后的执行工作。

虽然有JOIN字出现，其实查询优化器的工作会处理所有的查询类型，不单单JOIN联接查询。

二。首要优化

这部分讨论服务器执行的最重要优化。

1.优化常数关系

常数等值传递

如下的表达式会发生语句转化：

WHEREcolumn1 = column2ANDcolumn2 = ' x '

这种表达式，众所周知，如果A=B && B=C => A=C（可等值传递），上句表达式转化后变成：

WHEREcolumn1 = ' x ' ANDcolumn2 = ' x '

当且仅当，操作符为如下的任何一个，在column1 <操作符> column2条件中就会发生语句转化：

= , < , > , <= , >= , <> , <=> ,LIKE

注意：等值传递的转化，不适合于BETWEEN。可能也不适合于LIKE，这是后话。

常数等值传递同样发生在循环中，前一步传递的输出作为后一步传递的输入。

源代码见/sql/sql_select.cc，change_cond_ref_to_const()函数。或/sql/sql_select.cc，propagate_cond_constants()函数。

剔除死代码

总是TRUE的条件会发生语句转化，如：

WHERE 0 = 0 ANDcolumn1 = ' y '

这种情况下，第一个条件会被剔除，最后为：

column1 = ' y '

源代码见/sql/sql_select.cc，remove_eq_conds()。

总是FLASE的条件也会发生语句转化，如：

WHERE( 0 = ANDs1 = ORs1 = 7

小括号和前两个条件总是FLASE，最后为：

WHEREs1 = 7

还有一些情况下，当WHERE语句中代表不可能的条件，查询优化器可能会全部剔除语句，如下：

WHERE( 0 = ANDs1 = 5 )

因为这条件永远不为TRUE，在EXPLAIN分析中会显示Impossible WHERE。简单地说，MySQL会说WHERE条件被优化过。

如果一个字段不能为NULL，优化器会剔除所有不相关的IS NULL的条件，这样

WHEREnot_null_columnISNULL

这种条件总为FLASE情况；且

WHEREnot_null_columnISNOTNULL

这种条件总为TRUE情况，所以这种字段查询的条件也被剔除。这种判断是很微妙的。举个例：在一个OUT JOIN外联接，被定义成NOT NULL字段仍然含有NULL值，优化器就会单独排除IS NULL条件在这种特殊情况中。

优化器不会检查所有的Impossible WHERE的条件，因为这方面可能性太多了。例如：

CREATETABLETable1(column1CHAR( 1 ));
...
SELECT * FROMTable1WHEREcolumn1 = ' Popgo ' ;

优化器不会剔除这种查询的条件，即使在CREATE TABLE定义中使之成为不可能的条件。

可合并的常数值

如下表达式会发生语句转化：

WHEREcolumn1 = 1 + 2

最后为：

WHEREcolumn1 = 3

在之前说的常数等值传递，优化器很容易将这种查询语句合并在一起。这操作就简化了结果。

常数值和常数表

MySQL常数值，有时不单单指在查询的SQL语句的字面意思上，也可在常数表（constant tables）的内容里。常数表（constant tables）被定义为：

1。无记录或一条记录的表

2。表的表达式被WHERE条件约束，而且包含的表达式形式column = "constant"，或者表的主键的所有字段，或者任何唯一键的所有字段（唯一键的字段定义为NOT NULL）

例如，Table0表的定义包含：

...PRIMARYKEY(column1,column2)

然后，查询表达式：

FROMTable0...WHEREcolumn1 = 5 ANDcolumn2 = 7 ...

会返回常数表（constant tables）。更多简单地，如果Table1表的定义包含：

...unique_not_null_columnINTNOTNULLUNIQUE

然后，查询表达式：

FROMTable1...WHEREunique_not_null_column = 5

也会返回常数表（constant tables）。

这个规则指一个常数表（constant tables）至多有一条记录值。MySQL就会优先评估是否为常数表（constant tables），并找出那个值。这样，MySQL会将这值插入查询语句。如这个例子：

SELECTTable1.unique_not_null_column,Table2.any_column
FROMTable1,Table2
WHERETable1.unique_not_null_column = Table2.any_column
ANDTable1.unique_not_null_column = 5 ;

MySQL评估这语句时，首先就会发现，按照常数表（constant tables）的第二点定义，查询条件为unique_not_null_column的表Table1是一个常数表（constant tables），它就会取得这个值。

如果取值失败，也就是在表Table1里unique_not_null_column=没值，EXPLAIN后结果：

ImpossibleWHEREnoticedafterreading const tables

相反，如果取值成功，也就是在表Table1里unique_not_null_column=为一条记录值，MySQL会转化为如下语句：

SELECT 5 ,Table2.any_column
FROMTable1,Table2
WHERE 5 = Table2.any_column
AND 5 = 5 ;

事实上，这是一个很好的例子。优化器因前面提到的常数等值传递进行一些语句转化。另外，为什么要先描述常数等值传递，因为它在MySQL确认什么是常数表（constant tables）前就先进行了。优化器步骤的顺序，有时是有差别。

虽然很多查询都没常数表（constant tables）参考。应该牢记，以后无论什么时候，常数constant字被提及，它是指任何一个字面上的值或者一个常数表（constant tables）的内容。

2.优化JOIN联接

这部分讨论优化JOIN联接的不同方法。注意：JOIN联接不单单指JOIN类型，而是所有条件查询的类型。有些人更喜欢叫access type。

确定JOIN联接类型

当评估查询条件表达式时，MySQL会确定它是属于哪个JOIN联接类型。

如下有记录在档的JOIN类型，从最好到最坏的排序下来：

system：常数表（constant tables）的system类型
const：常数表（constant tables）
eq_ref：相等关系的唯一或主键索引
ref：相等关系的索引，此索引的值不能为NULL
ref_or_null：相等关系的索引，此索引的值可能为NULL
range：有关联的索引，如BETWEEN，IN，>=，LIKE等
index：顺序扫描索引
ALL：顺序扫描整个表数据

源代码见/sql/sql_select.h，enumjoin_type{}。另外，还有一小部分没记录在档，为了子查询的JOIN联接类型。

优化器利用JOIN联接类型选择一个驱动表达式，如下：

SELECT *
FROMTable1
WHEREindexed_column = ANDunindexed_column = 6

如果indexed_column有比较好的JOIN联接类型，它更可能成为驱动表达式。对它来说，你也会遇到各种不同的例外，但对这句描述，是第一个简单的优化法则。

对驱动来说，什么是最有意义的呢？如下查询时的两条执行路径：

最坏执行计划：扫描读表的所有行。这也叫Table1的顺序扫描或简单表扫描。查询每行，检查indexed_column和unindexed_column两列的值是否匹配查询的条件。

最好执行计划：通过索引，检索哪些有indexed_column=值的记录。这也叫被索引的搜索。查询每行，检查unindexed_column列的值是否匹配查询的条件。

被索引的搜索通常比顺序扫描调用更少的访问，而且如果访问的表是巨大的，索引又是唯一的，这样表的访问是非常少的。这也是为什么有好执行计划的访问表是更好的，并且这也是为什么常常把indexed_column做为驱动。

联接和访问的方法

在单表搜索中，坏的JOIN联接执行选择比坏的执行选择造成更多的性能损害。所以MySQL开发者发了更多的时间确保查询中的表以一种最佳顺序被联接和此最佳访问方法（常常被称访问路径）被选择作为检查表数据。表联接的固定顺序和相应的所有表的表访问方法的组合，叫做查询执行计划（QEP）。查询优化器的目的就是在所有可能的计划中找出一个最佳的QEP。JOIN联接优先后有一些常规的概念。

每个计划或计划的部分，被定义成COST成本。计划的成本粗略地反映了计算按照计划的查询所需要的资源，其中主要的因素是当计算查询时所以访问的记录总数。一旦我们有办法分配到不同的成本QEPs，我们有办法对它们进行比较。这样，优化器的目的就是在所有可能的计划中找到一个成本最低的QEP。

在MySQL中，实现了最佳QEP搜索是自下而上的方式。优化器首先确认一张表的所有计划，接着两张表的所有计划，以此类推，直到建立一个完整的最佳QEP。查询计划包括在查询中只有部分表和限定（predicates），被称为部分计划（partial plans）。优化器依赖着一点事实：越多表被加到部分计划（partial plans），成本就越高（注：成本高，执行效率就低）。这使得优化器可扩展更多的表只用较低成本的部分计划（partial plans）类比当前最好的完整计划。

完成搜索一条最佳QEP的关键路线见sql/sql_select.cc，find_best()。它执行了所有可能计划的详尽搜索，从而保证它最终将找到一个最佳的一条。

如下我们描述find_best()方法的伪代码。这是递归的，所以一些输入变量被标记了，以表明到目前为止，他们从前一个的迭代来的。

remaining_tables = {t1,...,tn}; /* alltablesreferencedinaquery */

procedurefind_best(
partial_plan in , /* in,partialplanoftables-joined-so-far */
partial_plan_cost, /* in,costofpartial_plan */
remaining_tables, /* in,setoftablesnotreferencedinpartial_plan */
best_plan_so_far, /* in/out,bestplanfoundsofar */
best_plan_so_far_cost) /* in/out,costofbest_plan_so_far */
{
for eachtableTfromremaining_tables
{
/* CalculatethecostofusingtableT.Factorsthatthe
optimizertakesintoaccountmayinclude:
Manyrowsintable(bad)
Manykeypartsincommonwithtablessofar(verygood)
RestrictionmentionedintheWHEREclause(good)
Longkey(good)
Uniqueorprimarykey(good)
Full-textkey(bad)
Otherfactorsthatmayatsometimebeworthconsidering:
Manycolumnsinkey
Shortaverage/maximumkeylength
Smalltablefile
Fewlevelsinindex
AllORDERBY/GROUPcolumnscomefromthistable */
cost = complex - series - of - calculations;
/* Addthecosttothecostsofar. */
partial_plan_cost += cost;

if (partial_plan_cost >= best_plan_so_far_cost)
/* partial_plan_costalreadytoogreat,stopsearch */
continue ;

partial_plan = expandpartial_planbybest_access_method;
remaining_tables = remaining_tables - tableT;
if (remaining_tables is notanempty set )
{
find_best(partial_plan,partial_plan_cost,
remaining_tables,
best_plan_so_far,best_plan_so_far_cost);
}
else
{
best_plan_so_far_cost = partial_plan_cost;
best_plan_so_far = partial_plan;
}
}
}

这里优化器利用了一种深度优先搜索算法。它完成了在FROM语句中评估所有的表。如果评估比起目前为止最好的评估，变得更差，它将停止搜索。扫描的顺序依赖于出现FROM语句中的表的顺序。

源代码见：/sql/table.h，struct st_table。

分析表（ANALYZE TABLE）可能会影响到一些优化器决断的因素。源代码见：/sql/sql_sqlect.cc，make_join_statistics()。

find_best()和greedy_search()的直截了当（straightforward）使用将不会用于LEFT JOIN或RIGHT JOIN。例如，从MySQL 4.0.14起，在一些情况下，优化器可能转变LEFT JOIN为STRAIHT JOIN，并交换表的顺序。另外见：LEFT JOINandRIGHT JOINOptimization。

RANGE联接类型

有些条件可以使用索引，但是在一个键的范围（range）或宽度内。这些称为范围条件，最常看到的是带>，>=，<，<=，IN，LIKE，BETWEEN的查询表达式。

对优化器来说，如下表达式：

column1IN( 1 , 2 , 3 )

和这个是一样的：

column1 = ORcolumn1 = ORcolumn1 = 3

MySQL同样对待这种语句，无需对查询条件的IN到OR或OR到IN做转变。

如下语句，优化器也会用到索引（范围查询range search）

column1LIKE ' x% '

但这种就不行：

column1LIKE ' % x% '

也就是说，如果匹配条件的第一个字符是通配符，那就没范围查询。

同样，如下两个语句也是一样的

column1BETWEEN 5 AND 7

和

column1 >= ANDcolumn1 <= 7

如果查询的条件，检索了太多的索引键，优化器可能转变RANGE联接类型为ALL JOIN联接类型。像这种转变，特别可能在<和>条件和多级第二索引（secondary indexes）中。源代码见：/myisam/mi_range.c，mi_records_in_range()（MyISAM索引）。

INDEX联接类型

考虑这个查询

SELECTcolumn1FROMTable1;

如果column1有加索引，那优化器可能选择从加的索引取值，而不是从表（全表扫描）。像这种方式的索引，一般称为覆盖索引（COVERING INDEX）。在EXPLAIN Extra描述中，MySQL会简单用INDEX单词来表示覆盖索引（COVERING INDEX）。

语句：

SELECTcolumn1,column2FROMTable1;

只有当索引被定义成如下，优化器会使用JOIN联接类型为INDEX ：join type = index

CREATEINDEX...ONTable1(column1,column2);

换句话说，被查询的字段（如：column1,column2）都必需被加索引的，被加索引的多个字段是无顺序之分的。因此，更有意义的严格定义一个多列索引（multiple-column index）作为一个覆盖索引（COVERING INDEX）来使用，无论搜索的考虑。

INDEX MERGE联接类型

概述

使用索引合并（INDEX MERGE），当表的条件可转化成如下：

cond_1ORcond_2...ORcond_N

转化的条件是：每个cond_i（cond_1，cond_2。。。）条件可用于范围扫描，且没有一对条件（cond_i，cond_j）用相同的索引。如果cond_i和cond_j条件使用相同的索引，那么cond_i或者cond_j条件能结合一个单一范围扫描，也就没合并的必要了。

如下查询就用了索引合并（INDEX MERGE）：

SELECT * FROMtWHEREkey1 = c1ORkey2 < c2ORkey3IN(c3,c4);

SELECT * FROMtWHERE(key1 = c1ORkey2 < c2)ANDnonkey = c3;

索引合并（INDEX MERGE），是实现成一种范围键（range key）并以cond_i（cond_1，cond_2。。。）条件构造成的容器。在做索引合并（INDEX MERGE）时，MySQL检索每个键扫描（keyscans）的行，然后通过一个消除重复的过程来运行它们。目前类Unique用于消除重复的。

INDEX MERGE优化器

单一SEL_TREE对象不能被构造成在OR语句中有不同成员的键的条件，类似这条件：

key1 < c1ORkey2 < c2

从MySQL5.0开始，这些条件被索引合并（INDEX MERGE）方法，和范围优化器（range optimizer）结构的类SEL_IMERGE处理。SEL_IMERGE代表了若干SEL_TREE对象的析取，这种被表示为：

sel_imerge_cond = (t_1ORt_1OR...ORt_n)

每个t_i（t_1，t_2。。。）代表一个SEL_TREE，没有一对（t_i，t_j）不同的SEL_TREE对象能被合并成单一的SEL_TREE对象。

目前的实现方法在构建SEL_IMERGE时，只有当没有单一的SEL_TREE对象能被构建成被分析过的查询的一部分；如果发现单一SEL_TREE对象能被构造，就会马上丢弃SEL_TREE。这实际是一个限制，并且可能导致最坏行检索策略的使用。如下查询：

SELECT * FROMtWHERE(goodkey1 = c1ORgoodkey1 = c2)ANDbadkey = c3

在badkey的扫描会被选择，即使在（goodkey1，goodkey1）上的索引合并（INDEX MERGE）会更快。

索引合并（INDEX MERGE）优化器会收集索引合并（INDEX MERGE）访问行的所有可能的路线列表。这种SEL_IMERGE结构列表表示如下的条件：

(t_11ORt_12OR...ORt_1k)AND
(t_21ORt_22OR...ORt_2l)AND
...AND
(t_M1ORt_M2OR...ORt_mp)

当t_ij是一个SEL_IMERGE且一个条件就是一个SEL_IMERGE对象。

最小成本的SEL_IMERGE对象用来检索行。

索引合并（INDEX MERGE）构造函数的详细信息见：源代码sql/opt_range.cc，imerge_list_and_list()，imerge_list_or_list()，和SEL_IMERGE类的成员函数。

RANGE优化器

为了范围RANGE查询，MySQL优化器构建一个SEL_TREE对象，如下这种形式：

range_cond = (cond_key_1ANDcond_key_2AND...ANDcond_key_N)

每一个cond_key_i都是一个键的组成部分的条件。MySQL为每个有用的键创建一个cond_key_i条件。然后这种成本最便宜的条件cond_key_i用来做范围RANGE扫描。

单一的cond_key_i条件是用SEL_ARG对象中的一个相联指针网（a pointer-linked network ofSEL_ARGobjects）来表示。每个SEL_ARG对象参考键的特定部分和表示如下的条件：

sel_arg_cond = (inf_val < key_part_nANDkey_part_n < sup_val)( 1 )
ANDnext_key_part_sel_arg_cond( 2 )
ORleft_sel_arg_cond( 3 )
ORright_sel_arg_cond( 4 )

1。实现间隔，可能没有上下临界，也或包括或没包括临界值。

2。实现SEL_ARG对象以下一个键组件作为条件（is for aSEL_ARGobject with condition on next key component）。

3。实现有间隔的SEL_ARG对象，在同样区域作为这个SEL_ARG对象（is for aSEL_ARGobject with an interval on the same field as thisSEL_ARGobject）。在当前对象和左边对象中的间隔，是不相交的。left_sel_arg_cond.sup_val <= inf_val。

4。实现有间隔的SEL_ARG对象，在同样区域作为这个SEL_ARG对象。在当前对象和右边对象中的间隔，是不相交的。 left_sel_arg_cond.min_val >= max_val。

MySQL会转变任意深度的嵌套AND-OR条件为上述相连接的形式。

行检索算法

索引合并（INDEX MERGE）有如下两个步骤：

准备阶段：

activate ' indexonly ' ;
foreach key_i in (key_scans\clustered_pk_scan)
{
while (retrievenext(key,rowid)pairfromkey_i)
{
if (noclusteredPKscan ||
rowdoesn ' tmatchclusteredPKscancondition)
putrowidintoUnique;
}
}
deactivate ' indexonly ' ;

行检索阶段：

for eachrowid in Unique
{
retrieverowandpassittooutput;
}
if (clustered_pk_scan)
{
while (retrievenextrow for clustered_pk_scan)
passrowtooutput;
}

源代码见：sql/opt_range.cc，QUICK_INDEX_MERGE_SELECT类函数的索引合并（INDEX MERGE）行检索代码。

3.换位（Transpositions）

MySQL支持简单语句表达式的换位（反转关系操作符的操作数的顺序）。换句话说：

WHERE - 5 = column1

此语句可转化成：

WHEREcolumn1 = - 5

然而，MySQL不支持有运算存在的换位，如：

WHERE 5 = - column1

而这句不能同等对待：

WHEREcolumn1 = - 5

像这形式column = constant表达式的换位是为了更好的索引检索。如果这种形式的语句有加了索引的字段，不论表的大小，MySQL始终使用上索引的。（例外：如果表无记录或只有一行记录，它就是常数表，需特别处理。见常数值和常数表）。

AND关系

一个AND的查询形式如condition1ANDcondition2，如下：

WHEREcolumn1 = ' x ' ANDcolumn2 = ' y '

这步骤描述了优化器决断的过程：

1。如果两个条件都没被索引，使用顺序扫描（全表扫描）。
2。除前一点之外，如果其中一个条件有更好的JOIN联接类型，则以JOIN联接类型选择一个驱动。（见 确定JOIN联接类型）
3。除前两点之外，如果两个条件都有加索引且平等的JOIN联接类型（注：JON 联接类型效果有好坏之分），则以第一个创建的索引选择一个驱动。

优化器也会根据索引交叉选择索引合并（INDEX MERGE），见INDEX MERGE联接类型。例子如下：

CREATETABLETable1(s1INT,s2INT);
CREATEINDEXIndex1ONTable1(s2);
CREATEINDEXIndex2ONTable1(s1);
...
SELECT * FROMTable1WHEREs1 = ANDs2 = 5 ;

当选择一种策略来解决这个查询，优化器会选择s2 = 5作为驱动，由于s2上的索引首先被创建。视为一个偶然的效果，而不是一种规则，在任何时刻都有可能会改变的。

OR关系

一个OR的查询形式如condition1ORcondition2，如下：

WHEREcolumn1 = ' x ' ORcolumn2 = ' y '

这种查询优化器的决断是使用顺序全表扫描。

还有一种选择在特定的环境下会使用索引合并（INDEX MERGE），更多信息见INDEX MERGE优化器和Index Merge Optimization。

上述的特定情况不能用于如果两条件的字段是一样。如下：

WHEREcolumn1 = ' x ' ORcolumn1 = ' y '

这种情况，由于语句是RANG查询，所以会走索引的。这个话题会在IN限定（predicate）的讨论中再次看到。

UNION查询

所有含有UNION的SELECT查询语句会被各自优化。因此，这个查询：

SELECT * FROMTable1WHEREcolumn1 = ' x '
UNIONALL
SELECT * FROMTABLE1WHEREcolumn2 = ' y '

如果column1和column2都有索引的，每个SELECT都会使用索引扫描，各自的结果集会被合并。注意：此查询可能产生相同的结果集，如果查询使用了顺序扫描OR的例子。

NOT（<>）关系

一个逻辑条件如下：

column1 <> 5

等价于：

column1 < 5 ORcolumn1 > 5

然而，MySQL不会对这种条件进行转化语句。如果你觉得用RANG查询效果会更好，你必需自己手动做语句转化。

还有一个逻辑条件如下：

WHERENOT(column1 != 5 )

等价于：

WHEREcolumn1 = 5

对这种情况，MySQL也不会做语句转化的。

我们期待能针对上述两个情况加入新的优化方法。

ORDER BY语句

通常，如果优化器发现行记录不管怎么样都是有序的，在ORDER BY语句中它也会跳过SORT过程。但是还是验证几个例外的情况。

例：

SELECTcolumn1FROMTable1ORDERBY ' x ' ;

优化器会扔掉ORDER BY语句，这也是死代码删除一个例子。

例：

SELECTcolumn1FROMTable1ORDERBYcolumn1;

优化器会使用column1的索引，如果存在的话。

例：

SELECTcolumn1FROMTable1ORDERBYcolumn1 + 1 ;

优化器会使用column1的索引，如果存在的话。但是不要被弄混了，索引只用来查找记录值。另外：顺序扫描索引的成本比顺序扫描全表的成本是更便宜的（一般索引的大小会比数据值的大小小的），这也是为什么INDEX JOIN联接类型会比ALL类型更优化。见确定JOIN联接类型。

还有一种结果集的全部排序SORT，例：

SELECT * FROMTable1
WHEREcolumn1 > ' x ' ANDcolumn2 > ' x '
ORDERBYcolumn2;

如果column1和column2都有索引的，优化器会走在column1上的索引。在这个查询语句，对column2值的排序不会影响驱动的选择。

源代码见：/sql/sql_select.cc，test_if_order_by_key()和/sql/sql_select.cc，test_if_skip_sort_order()。

ORDER BYOptimization，描述了SORT排序过程的内容机制，在这里不重复解释。但恳请你一定要阅读，因为它描述了缓冲和快速排序机制的操作。

GROUP BY和相关的条件

这里描述了GROUP BY和相关条件（HAVING，COUNT()，MAX()，MIN()，SUM()，AVG()，DISTINCT()）的主要优化。

GROUP BY会使用索，如果一个索引存在的话。
GROUP BY会用排序，如果没有索引存在。优化器可能选择使用HASH表排序。
GROUP BY x ORDER BY x的情况，优化器会因为GROUP BY会以 x 的排序，而认为ORDER BY是不需要的。
优化器包含了为转移特定HAVING条件的WHERE语句中的代码。然而，此代码在编写时是不生效的。源代码见：/sql/sql_select.cc，JOIN::optimize()，在#ifdef HAVE_REF_TO_FIELDS之后。
如果表句柄（handler）有个有效的快速行总数（row-count），那么这个查询：

SELECTCOUNT( * )FROMTable1;

不必扫描所有行，就能得到行总数值。这只对MyISAM表是正确的，但不适合InnoDB表。另外这个查询

SELECTCOUNT(column1)FROMTable1;

不会有同样的优化，除非column1被定义为NOT NULL。

MAX()和MIN()新的优化方法。例：

SELECTMAX(column1)
FROMTable1
WHEREcolumn1 < ' a ' ;

如果column1被索引了，就很容易找到最大值通过查询索引中的'a'值并且在这之前返回索引键。

优化对如下形式的查询，进行语句转化：

SELECTDISTINCTcolumn1FROMTable1;

成：

SELECTcolumn1FROMTable1GROUPBYcolumn1;

当且仅当这两个条件都是正确：

*GROUP BY能通过索引来未完成。这暗示了只有一个表在FROM语句中且没有WHERE语句。
*没有LIMIT语句。

因为DISTINCT语句并不总是被转化成GROUP BY，不要期望含有DISTINCT查询语句总会有被排序的结果集。然而，你能依赖GROUP BY优化规则，除非查询包括ORDER BY NULL。

三。其它优化

这部分，讨论其它更特别的优化方法。

1. ref和eq_ref的NULLs值过滤访问

这部分讨论ref和eq_ref联接类型的NULLs值过滤优化方法。

前期（early）NULLs值过滤

假设我们有个联接顺序如下：

...,tblX,...,tblY,...

更深入假设，表tblY通过ref或eq_ref 联合类型被访问：

tblY.key_column = tblX.column

或者，使用多个键部分的ref类型访问：

...ANDtblY.key_partN = tblX.columnAND...

tblX.column可以为NULL。ref（或eq_ref）类型访问时，前期会应用NULLs过滤。我们做如下的推断：

(tblY.key_partN = tblX.column) => (tblX.columnISNOTNULL)

原等式的检查只有在读了表tblX和tblY的当前行记录后。IS NOT NULL限定（predicate）的检查，只有在读了表tblX的当前行记录后。如果在表tblX和tblY的联合排序中有任何

其它表，IS NOT NULL限定（predicate）的检查就允许我们跳过访问这些表。

这个特性的实现代码如下：

ref分析器（包含方法update_ref_and_keys()）通过设置KEY_FIELD::null_rejecting=TRUE检查和标记像上述这种类型的查询等式。
选择JOIN联接排序以后，add_not_null_conds()会增加适当的IS NOT NULL限定（predicate）到适当表的相关条件中。

对所有等式加了IS NOT NULL限定（predicate）是有可能被ref访问类型使用（而不是那些有实际使用的）。然而，目前没这样做。

后期（Late）NULLs过滤

假设我们有一个表tblX查询计划，是通过ref访问类型被访问：

tblX.key_part1 = expr1ANDtblX.key_part2 = expr2AND...

在调用索引检索前，我们确定任何expri（expr1，expr2，expr3。。。）值是否为NULL。如果是，我们不会调用检索，而是会马上返回没找到匹配数组。

这个优化方法重用了由前期（early）NULLs过滤产生的null_rejecting属性。这个检查的源代码见：函数join_read_always_key()。

2.分区相关的优化

这部分讨论MySQL分区相关的优化。MySQL5.1分区相关概念和实现见：Partitioning。

分区裁剪（pruning）

分区裁剪（partition pruning）的操作，如下定义：

“提供一个分区表的查询，比对此分区表的DDL语句和查询中的任何WHERE或ON语句，且找出这查询访问的最小分区集。”

这样得到的分区集会比表所有分区的集合小很多，这个分区集也是之后查询语句要用到的。没被加入这个分区集的其它分区，就不会被访问的，也就是说被裁剪掉的分区。正因为这样，查询的执行速度变得更快。

Non-Transactional Table Engines.??如MyISAM无事务存储引擎，锁会被加在整个分区表。理论上讲，使用分区裁剪（partition pruning）是有可能提高并发，只把锁加在被使用的分区上。但是目前还没实现这功能。

分区裁剪（partition pruning）不依赖表的存储引擎，所以这功能是MySQL查询优化器的一部分。接下来章节描述分区裁剪（partition pruning）的细节。

分区裁剪概述

分区裁剪（partition pruning）的实现步骤如下：

1。分析WHERE语句条件并构造区间图 interval graph，用来描述分析的结果情况。

2。通过区间图，为每个区间找出被访问的分区集（包括子分区）。

3。构造查询所需要的分区集。

区间图interval graph是自下而上的方式构造成，并来表示上述步骤的描述。接着讨论，我们会首先定义术语区间图interval graph，接着描述怎样用分区区间来组成一个区间图interval graph，最后描述区间图interval graph的工作流程。

分区区间（Partitioning Intervals）

单点区间（Single-Point Intervals）

从最简单的情况开始，假设一个有N个列的分区表，通过分区类型p_type和分区函数p_func，表示如下：

CREATETABLEt(columns)
PARTITIONBYp_type(p_func(col1,col2,...colN)...);

再假设查询的WHERE条件形式如下：

WHEREt.col1 = const1ANDt.col2 = const2AND...t.colN = constN

我们能计算出p_func(const1, const2 ... constN)，并挖掘出哪个分区包含的记录和WHERE条件一样。注意：这个流程会在所有的分区类型和所有的分区函数上操作。

注意：此流程只工作在，如果WHERE条件的形式像上述那样，表的每个列必需被验证是否等与一些任意常数（不需要相同的常数为每列）。例如，如果上述例子的WHERE语句中没有col1=const1，那么我们不会计算p_func分区函数的值，也就不会约束实际被用的分区集。

区间游历（Walking）

假设一个分区表t被定义成columns列集，分区类型p_type，分区函数p_func使用integer类型字段int_col，如下：

CREATETABLEt(columns)
PARTITIONBY
p_type(p_func(int_col))
...

假设我们有如下形式的WHERE条件查询：

WHEREconst1 <= int_col <= const2

我们能缩小此情况的条件成一系列单点区间（Single-Point Intervals），如下，通过转化此WHERE语句为以下关系：

int_field = const1OR
int_field = const1 + 1 OR
int_field = const1 + 2 OR
...OR
int_field = const2

在源代码里，这种转化被称作区间游历（Walking）。游历短的区间成本是不贵的，这样我们能缩小分区数来扫描小的分区。然尔，游历长的区间不是那么非常有效的，需要检查大量的分区，这样的话，可能所有分区都会被扫描的。

如下参数决定区间游历（Walking）的值：

#define MAX_RANGE_TO_WALK=10

注意：如下条件关系也会利用上述区间游历（Walking）的逻辑：

const1 >= int_col >= const2

区间映射（mapping）

假设如下的分区表定义：

CREATETABLEt(columns)
PARTITIONBYRANGE | LIST(unary_ascending_function(column))

假设我们对表t的查询的WHERE语句，是如下形式中的一种：

const1 <= t.column <= const2
t.column <= const2
const1 <= t.column

自分区函数是升序，看如下的关系：

const1 <= t.col <= const2

=> p_func(const1) <=

p_func(t.column) <= p_func(const2)

用A和B表示这关系的最左和最右部分，我们能重写关系为：

A <= p_func(t.column) <= B

注意：在这实例中，区间是关闭的且有两个界值。但是，类似的推论可以类推到其它类型的区间。

如范围分区（RANGE partitioning），每个分区占据一个区间于分区函数值的轴线上，每个区间是不相连的，如下：

p0p1p2
tablepartitions ------ x ------ x -------- x -------->

searchinterval ---- x ============== x ----------->
AB

一个分区需要被访问，当且仅当如果它的区间和搜索区间[A, B]没有空的交叉点。

如列举分区（LIST partitioning），每个分区包括点集于分区函数值的轴线上，各分区会产生不同的交叉点，如下：

p0p1p2p1p1p0
tablepartitions --+---+----+----+----+----+---->

searchinterval ---- x =================== x ------>
AB

一个分区需要被访问，至少一个交叉点在搜索区间[A, B]里。所用的分区集可确定运行从A到B，并收集它们的点在这个搜索范围内的分区。

子分区区间（subpartitioning intervals）

在前面部分我们描述几种从基本的WHERE条件推断出在用分区集。一切都表明，这些分区的推断方法都适合于子分区，除范围分区（RANGE partitioning）和列举分区（LIST partitioning）的子分区外。

自每个分区以同样的方式被分子分区，我们会找出在每个分区内的哪个子分区会被访问。

从WHERE语句到区间（From WHERE Clauses to Intervals）

之前的章节讲述了，从表示分区和子分区区间的WHERE语句推断出分区集。现在我们看看如何从任意WHERE语句抽出区间。

抽取的流程使用范围分析器（RANGE Analyzer），属于MySQL优化器的一部分，它产生范围RANGE访问的计划。这是因为这个任务是相似的。两种WHERE语句的形式：RANGE访问类型使用索引范围（区间）扫描；分区裁剪（partition pruning）模块使用分区区间，用来决定哪个分区被使用。

为了分区裁剪（partition pruning），范围分析器（RANGE Analyzer）与WHERE语句被调用，一个由分区和子分区函数使用的表的列清单：

(part_col1,part_col2,...part_colN,
subpart_col1,subpart_col2,...subpart_colM)

范围分析器（RANGE Analyzer）工作的结果被称为SEL_ARG图。这是一个很复杂的结构，我们不打算在这里描述它。目前这个文化讨论的重点是我们能游历所有分区，并收集分区和子分区的区间。

如下例子阐明结构和游历流程。假设表t按如下的分区：

CREATETABLEt(...,pfINT,sp1CHAR( 5 ),sp2INT,...)
PARTITIONBYLIST(pf)
SUBPARTITIONBYHASH(sp1,sp2)(
PARTITIONp0VALUESIN( 1 ),
PARTITIONp1VALUESIN( 2 ),
PARTITIONp2VALUESIN( 3 ),
PARTITIONp3VALUESIN( 4 ),
PARTITIONp4VALUESIN( 5 ),
);

现假设对表t的一个很复杂的WHERE语句查询：

pf = 1 AND(sp1 = ' foo ' ANDsp2IN( 40 , 50 ))

OR

(pf1 = 3 ORpf1 = 4 )ANDsp1 = ' bar ' ANDsp2 = 33

OR

((pf = 3 ORpf = 4 )ANDsp1 = 5 )

OR

p = 8

SEL_ARG图如下：

(root)
| :
| Partitioning:Sub - partitioning
| :
| :
| :
| +------+ : +-----------+ +--------+
\ ---| pf = 1 |---- : -----| sp1 = ' foo ' |---| sp2 = 40 |
+------+ : +-----------+ +--------+
| : |
| : +--------+
| : | sp2 = 50 |
| : +--------+
| :
| :
+------+ : +-----------+ +--------+
| pf = 3 |---- : --+--| sp1 = ' bar ' |---| sp2 = 33 |
+------+ : | +-----------+ +--------+
| : |
+------+ : |
| pf = 4 |---- : --+
+------+ :
| :
| :
+------+ : +-----------+
| pf = 8 |---- : -----| sp1 = ' baz ' |
+------+ : +-----------+

上述图表，竖的边界（|）代表OR，横的（-）代表AND，横的和竖的线也代表AND。

分区裁剪（partition pruning）代码游历从图上方到下方，从左边到右边，并做了如下的推论

1。在最上和最左的区间，从使用分区的空集合开始游历：

2。

执行pf=1的区间分析，找到分区P0的相应集合，右移到sp1='foo'
再次右移，到sp2=40
分析sp1='foo' AND sp2=40区间，在某SP1子分区找到行。推论一：在每个分区组成集合P0，标识子分区SP1“被使用”
下移到sp2=50
分析sp1='foo'区间和sp2=50区间，在某SP2子分区找到行。推论二：在每个分区组成集合P0，标识子分区SP2“被使用”
移回到pf=1，然后下称到pf=3

3。

执行pf=3的区间分析，找到分区P1的相应集合，右移到sp1='bar'
再次右移，到sp2=33
分析sp1='bar' ANDsp2=33区间，在某SP3子分区找到行。推论三：在每个分区组成集合P1，标识子分区SP3“被使用”
移回到pf=3，然后下移到pf=4

4。

执行pf=4的区间分析，找到分区P2的相应集合，右移到sp2='bar'
执行移动和类似的推论已在pf=3验证正确。这样的效果是比较差的，因为我们将再次分析sp1='bar' ANDsp2=33区间，但这个操作不会很大影响到整体性能。
移回到pf=3，然后下称到pf=8

5。

执行pf=8的区间分析，找到分区P3的相应集合，右移到sp1='baz'
现在到了sp1='baz'，发现不能再向右移动，也不能构建子分区区间。我们记录下，并返回pf=8
从之前的过程，我们不能再限制子分区区间了，所以推论：在P3分区集里的每个分区，假设所有的子分区都是有效在用的。

6。尝试从pf=9下移，发现到尾，所以游历图也就完成。

注意：在特定的情况下，范围分析器（RANGE Analyzer）的结果会有几种的SEL_ARG图，这图是由OR或AND操作符组成的。出现这种情况对于WHERE语句，要么是非常复杂的要么不允许一个单一的区间列表构建。对这种情况，分区裁剪（partition pruning）代码采用合适的操作，例：

SELECT * FROMt1WHEREpartition_id = 10 ORsubpartition_id = 20

在这个实例中，没有单一的区间被构建，但分区裁剪（partition pruning）代码正确地推断了使用的分区集是联合：

所有在分区里的子分区包含了partition_id=10的行，在每个分区里一个子分区包含subpartition_id=20的行。

源代码中分区裁剪（partition pruning）实现

源代码的简单解说：

sql/opt_range.cc：

这代码包含了 从WHERE语句到区间（From WHERE Clauses to Intervals）的实现，方法 prune_partitions()。关于 分区裁剪（partition pruning）的都有详细的行行代码注释，从 PartitionPruningModule代码开始：

sql/partition_info.h：

class partition_info{
...
/*
Bitmapofused(i.e.notprunedaway)partitions.Thisiswhereresult
ofpartitionpruningisstored.
*/
MY_BITMAPused_partitions;

/*
"virtualfunction"pointerstofunctionsthatperformintervalanalysis
onthispartitionedtable(usedbythecodeinopt_range.cc)
*/
get_partitions_in_range_iterget_part_iter_for_interval;
get_partitions_in_range_iterget_subpart_iter_for_interval;

};

sql/sql_partition.cc：

这代码包含了实现所有分区区间分析类型的方法。

分区检索

如果分区表被一系列索引检索（即ref，eq_ref，ref_or_null联接访问方式）访问，MySQL会检查是否需要所有分区做索引检索或者限制访问到一个特定的分区。例：

CREATETABLEt1(aINT,bINT);

INSERTINTOt1VALUES( 1 , 1 ),( 2 , 2 ),( 3 , 3 );

CREATETABLEt2(
keypart1INT,
keypart2INT,
KEY(keypart1,keypart2)
)
PARTITIONBYHASH(keypart2);

INSERTINTOt2VALUES( 1 , 1 ),( 2 , 2 ),( 3 , 3 );

查询条件如下：

SELECT * FROMt1,t2
WHEREt2.keypart1 = t1.a
ANDt2.keypart2 = t1.b;

利用如下算法执行：

( for eachrecord in t1:)
{
t2 -> index_read({current - value - of(t1.a),current - value - of(t1.b)});
while (t2 -> index_next_same())
passrowcombinationtoqueryoutput;
}

在index_read()调用中，分区表句柄会挖掘出被确定所有分区列的值，在这个例子中，是单一列b，接着找出一个分区访问。如果这个分区被裁剪过，就没其它的分区可访问。

-EOF-

Popgo@XM Senior DBA
Full-timeLinux/AIXSA&&MySQL/OracleDBA
GTK/Email/MSN:[email protected]
QQGroup Unix DBA:10098435

分享到：

jQuery Ajax 应用实例 | SQLServer性能优化之活用临时表

2010-07-27 17:38
浏览 239
评论(0)
相关推荐

发表评论

您还没有登录,请您登录后再发表评论

你可能感兴趣的:(sql,算法,mysql,应用服务器,搜索引擎)

day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
在线人数统计业务设计（场景八股文）
业务问题在当经的网站中，在线人数的实时统计已经是一个必不可少的模块了，并且该统计功能最好能够按不同的时间间隔做的统计，现在需要你设计一个在线人数统计的模块，你应该怎么进行设计的呢？背景一个网校下会有多个学员。目前平台大概有十个，平台对应的网校大概五十几个，平均一个网校会有5w个用户，预计总人数为200w，最该学员的在线人数在10w左右。设计思路最开始的时候，想到的就是使用mysql直接实现，但是明
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
mysql复习立夏的李子 mysql 数据库 database
mysqlselect语法selectfromjoinwheregroupbyhavingorderbylimit联合查询innerjoin（）leftjoin（以左表为基准，匹配右表，不匹配的返回左表，右表以null值填充）rightjoind··(去除列重复的数据)索引类型主键索引(PrimaryKey)唯一索引(Unique)常规索引(Index)全文索引(FullText)索引准则索引不是
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
量子计算解决气候变化：科学家找到了新方法大力出奇迹985 量子计算
气候变化已成为全球面临的严峻挑战，传统计算方法在应对与之相关的复杂问题时存在诸多局限。而量子计算作为新兴技术，为解决气候变化难题带来曙光。本文深入剖析科学家利用量子计算应对气候变化的新方法。量子计算凭借独特的量子比特与量子特性，在加速气候模型计算、优化模型参数、预测极端天气事件等方面展现出巨大优势。同时，在可再生能源整合、电网管理、碳捕获等实际应用场景中也发挥着重要作用。尽管目前面临硬件和算法等方
用代码生成艺术字：设计个性化海报的秘密
本文围绕“用代码生成艺术字：设计个性化海报的秘密”展开，先概述代码生成艺术字在海报设计中的独特价值，接着介绍常用的代码工具（如HTML、CSS、JavaScript等），详细阐述从构思到实现的完整流程，包括字体样式设计、动态效果添加等，还分享了提升艺术字质感的技巧及实际案例。最后总结代码生成艺术字的优势，为设计师提供打造个性化海报的实用指南，助力提升海报设计的独特性与吸引力，符合搜索引擎SEO标准
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
算法刷题-动态规划之背包问题
1.背包问题之01（4.30）题目描述小明有一个容量为VV的背包。这天他去商场购物，商场一共有NN件物品，第ii件物品的体积为wiwi，价值为vivi。小明想知道在购买的物品总体积不超过VV的情况下所能获得的最大价值为多少，请你帮他算算。输入描述输入第11行包含两个正整数N,VN,V，表示商场物品的数量和小明的背包容量。第2∼N+12∼N+1行包含22个正整数w,vw,v，表示物品的体积和价值。1
Spark SQL架构及高级用法 Aurora_NeAr spark sql 架构
SparkSQL架构概述架构核心组件API层（用户接口）输入方式：SQL查询；DataFrame/DatasetAPI。统一性：所有接口最终转换为逻辑计划树（LogicalPlan），进入优化流程。编译器层（Catalyst优化器）核心引擎：基于规则的优化器（Rule-BasedOptimizer,RBO）与成本优化器（Cost-BasedOptimizer,CBO）。处理流程：阶段输入输出关键动
Mac OSX 下的mysql数据库文件存放位置 Bruuuces mysql mac osx 位置存放
之前我的mysql的系统数据库里的表被我玩坏了，万般无奈之下只得删除所有mysql的东西重新构建数据库。按照网上搜到的内容删除后重装发现数据库没有什么变化。于是自己在每个可能存放数据库文件的目录查找，最终确认目录位置如下:使用HomeBrew安装为/usr/local/var/mysql使用官方下载的dmg镜像安装为/usr/local/mysql删除这个目录再重新安装mysql就会重新生成系统数
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
mac os 10.9 mysql_MAC OSX 10.9 apache php mysql 环境配置 AY05 mac os 10.9 mysql
＃终端内运行sudoapachectlstart#启动Apachesudoapachectlrestart#重启Apachesudoapachectlstop#停止Apache＃配置Apachesudovi/private/etc/apache2/httpd.conf#将里面的这一行去掉前面的##LoadModulephp5_modulelibexec/apache2/libphp5.so＃配置P
mac升级mysql_Mac OSX下的MySQL数据库升级 weixin_39801714 mac升级mysql
MacOSX下的数据库升级最麻烦的不过权限的问题.本文的MySQL的安装方式为OSX下DMG磁盘镜像的安装方式,MacPorts/Homebrew的方式大同小异.从5.6.17升级到5.7.18安装目录信息ls-al/usr/local|grepmysqllrwxr-xr-x1rootwheel30B52100:39mysql@->mysql-5.6.17-osx10.7-x86_64drwxr-
【MySQL】MySQL数据库如何改名武昌库里写JAVA 面试题汇总与解析 spring boot vue.js sql java 学习
MySQL建库授权语句https://www.jianshu.com/p/2237a9649ceeMySQL数据库改名的三种方法https://www.cnblogs.com/gomysql/p/3584881.htmlMySQL安全修改数据库名几种方法https://blog.csdn.net/haiross/article/details/51282417MySQL重命名数据库https://
大学社团管理系统（11831） codercode2022 java spring boot spring echarts spring cloud sentinel java-rocketmq
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发四、项目截图有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
顺时针旋转N * N 的矩阵忆杰算法 Python 矩阵 python 算法
顺时针旋转题目描述数据范围实现逻辑代码实现题目描述有一个NxN整数矩阵，请编写一个算法，将矩阵顺时针旋转90度。给定一个NxN的矩阵，和矩阵的阶数N,请返回旋转后的NxN矩阵。数据范围0852789963'''#第N列逆序后变成第N行#或者是第i行变成第N-i-1列代码实现classSolution:#列转换为行defline2Row(self,mat,n):arr=[]forlineinrang
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那