咖啡啡不加糖

由浅入深：全面解析MySQL索引原理、应用与优化

引言

MySQL作为当今最流行的关系型数据库之一，凭借其出色的性能、低廉的成本和丰富的社区资源，成为了绝大多数互联网公司的首选。在日常的开发工作中，我们经常会遇到数据库性能问题，尤其是在处理复杂查询时。而索引，作为提升数据库查询效率的关键技术，其重要性不言而喻。

一、MySQL索引基础概念

1. 索引的定义与作用

MySQL官方对索引的定义为：索引是帮助MySQL高效获取数据的数据结构，索引对于良好的性能非常关键，尤其是当表中的数据量越来越大时，索引对于性能的影响愈发重要。

通俗来讲，索引类似于书籍的目录，用来提高查询的效率。如同我们通过书籍目录快速找到所需内容一样，数据库系统也可以通过索引快速定位到表中的特定信息，而无需进行全表扫描。

索引的主要作用体现在以下几个方面：

首先，索引能够显著加快数据检索速度。通过索引可以快速定位到符合条件的数据，避免全表扫描，这在大型数据库中尤为重要。想象一下，在一个包含数百万条记录的表中查找特定数据，如果没有索引，系统需要逐行检查每一条记录，这将是一个极其耗时的过程。而有了索引，系统可以直接跳转到包含目标数据的位置，大大减少了查询时间。
其次，索引能够降低服务器负载。由于索引减少了数据库服务器需要扫描的数据量，因此降低了I/O次数，减轻了CPU和内存的消耗，从而提高了服务器的处理能力和响应速度。在高并发的应用场景中，这一点尤为重要，它可以使系统支持更多的并发用户。
此外，索引还能够支持排序和分组操作。利用索引可以加快ORDER BY和GROUP BY操作的执行速度，因为索引本身就是有序的，可以避免额外的排序操作。这对于需要频繁排序或分组的查询来说，可以带来显著的性能提升。
最后，索引可以实现数据的唯一性约束。通过创建唯一索引，可以保证表中某列或多列组合的值的唯一性，这是实现数据完整性的重要手段。

2. 索引的基本原理

索引的本质是通过不断缩小想要获得数据的范围来筛选出最终想要的结果，同时把随机的事件变成顺序的事件。这一过程与我们查字典的方式非常相似。

当我们查找"mysql"这个单词时，首先会定位到字母"m"开头的部分，然后在这个范围内找到"my"开头的部分，再进一步缩小到"mys"，最终找到"mysql"。这种逐步缩小范围的查找方式，正是索引工作的基本原理。

在数据库中，索引通过特定的数据结构来组织数据，使得系统可以快速定位到需要的数据，而不必遍历整个表。这种数据结构需要满足高效的查找、插入和删除操作，同时还要考虑到磁盘I/O的特性。

2.1 磁盘I/O与预读

理解索引原理需要了解磁盘I/O的特性。磁盘读取数据是一个相对较慢的过程，主要包括三个部分的时间消耗：寻道时间（磁臂移动到指定磁道所需的时间，约5ms）、旋转延迟（等待目标扇区旋转到磁头下的时间，如7200转/分的磁盘约4.17ms）和传输时间（从磁盘读出数据的时间，通常可忽略不计）。因此，一次磁盘I/O的时间约为9ms左右，这在计算机的世界里是一个相当长的时间。

为了优化这一过程，操作系统引入了"预读"机制。当一次I/O时，系统不仅读取当前需要的数据，还会读取相邻的数据到内存缓冲区，这是基于局部性原理——当访问了某个数据，其附近的数据也很可能会被访问。每一次I/O读取的数据称为一页（page），一般为4k或8k。这种机制大大减少了I/O次数，提高了数据访问效率。

2.2 索引的数据结构

为了最大限度地减少磁盘I/O次数，索引的数据结构需要满足以下要求：每次查找数据时把磁盘I/O次数控制在一个很小的数量级，最好是常数级；能够有效支持范围查询、模糊查询等多种查询方式。

基于这些需求，B+树成为了MySQL索引的主要数据结构。B+树是一种多路平衡查找树，具有以下特点：所有叶子节点具有相同的深度；所有数据都存储在叶子节点上；非叶子节点只存储键值信息，不存储实际数据；叶子节点之间通过指针连接，形成有序链表。

这种结构使得B+树特别适合用于数据库索引：树的高度一般在2-4层，即使存储大量数据，查找也只需要2-4次磁盘I/O；叶子节点形成的有序链表便于范围查询；非叶子节点不存储数据，可以在同样大小的节点中存储更多索引项，降低树的高度。

3. 索引的优缺点

索引虽然能够显著提升查询性能，但也存在一些缺点，需要在实际应用中权衡利弊。

优点：

加快了数据的检索速度。在大型数据库中，一个良好设计的索引可以将查询时间从几分钟缩短到几毫秒，这对于用户体验和系统性能都至关重要。
可以创建唯一性约束，保证数据库表中每一行数据的唯一性。这不仅是数据完整性的保障，也能避免数据重复带来的存储和处理开销。
能够加速表与表之间的连接操作。在关系型数据库中，表连接是一种常见的操作，而索引可以使这种操作更加高效。
在使用分组和排序子句进行数据检索时，可以显著减少查询中分组和排序的时间，因为索引本身就是有序的，可以避免额外的排序操作。

缺点：

创建和维护索引需要耗费时间和空间成本。每个索引都需要占用物理存储空间，而且索引越多，所需的存储空间就越大。
当对表中的数据进行增加、删除和修改操作时，索引也需要动态地维护，这会降低数据的维护速度。特别是在高频写入的场景下，过多的索引可能会成为性能瓶颈。
索引虽然加快了查询速度，但也增加了数据库的复杂性。开发人员需要了解索引的工作原理和使用策略，才能设计出高效的索引方案。

4. 常见应用场景

索引在以下场景中特别有用：

频繁作为查询条件的字段是创建索引的首选。例如，用户表中的用户ID、用户名等经常用于查询的字段，为这些字段创建索引可以显著提高查询效率。
需要排序的字段也是索引的良好候选。如订单表中的创建时间，如果经常需要按时间排序查询，为创建时间字段建立索引可以避免额外的排序操作。
同样，需要分组的字段也适合创建索引。例如，在统计不同类别商品的销量时，为商品类别字段创建索引可以加速GROUP BY操作。
多表连接的字段是另一个重要的索引应用场景。如订单表和用户表之间的用户ID，为这些连接字段创建索引可以大大提高连接操作的效率。
范围查询的字段也适合创建索引。如时间范围、价格区间等，索引可以快速定位到范围的起始位置，然后顺序扫描到范围的结束位置。

在实际应用中，索引的使用需要根据具体的业务场景和查询需求来设计，合理的索引设计可以显著提升系统性能。

二、MySQL索引类型与数据结构

MySQL支持多种类型的索引，每种类型都有其特定的应用场景和性能特点。了解这些索引类型及其底层数据结构，对于优化数据库性能至关重要。

1. B-Tree索引

B-Tree（平衡树）是MySQL中最常用的索引类型，几乎所有的存储引擎都支持这种索引。B-Tree索引适用于全键值、键值范围或键前缀查找，是大多数查询场景的首选索引类型。

1.1 B-Tree的结构与特点

B-Tree是一种多路平衡查找树，具有以下特点：所有节点存储数据；所有叶子节点在同一层；每个节点包含多个关键字和指向子节点的指针；关键字按顺序排列；每个节点的关键字个数在一定范围内。

这种结构使得B-Tree能够在较少的磁盘访问次数内完成查找操作。如果要查找数据，则从根节点开始，依次向下查找，直到找到对应的叶子节点。由于树的高度通常很低（通常为2-4层），因此查找操作只需要很少的磁盘I/O。

1.2 B+Tree索引

B+Tree是B-Tree的一种变种，也是InnoDB和MyISAM等存储引擎默认使用的索引数据结构。相比B-Tree，B+Tree有以下几点改进：

首先，B+Tree中的数据只存储在叶子节点上，非叶子节点只存储索引键值，不存储实际数据。这样设计的好处是，在相同大小的节点下，B+Tree可以存储更多的键值，从而降低树的高度，减少磁盘I/O次数。
其次，B+Tree的所有叶子节点通过指针连接，形成一个双向链表。这种结构非常适合范围查询和全表扫描，因为一旦找到范围的起始位置，就可以沿着链表顺序访问所有满足条件的数据，而不需要回到上层节点重新查找。
最后，B+Tree更适合磁盘存储。B+Tree的节点大小可以设计为等于磁盘页的大小，这样每个节点只需一次I/O就可以完全载入。而且，由于非叶子节点不存储数据，可以在同样大小的节点中存储更多的索引项，进一步降低树的高度。

1.3 B+Tree索引的查询过程

B+Tree索引的查询过程可以分为精确查找和范围查询两种情况：

对于精确查找，如SELECT * FROM users WHERE id = 10，查询过程如下：从根节点开始，比较索引值，确定下一步要查找的子节点；重复上述过程，直到找到叶子节点；在叶子节点中找到对应的数据行或主键值。
对于范围查询，如SELECT * FROM users WHERE id BETWEEN 10 AND 20，查询过程如下：先找到范围的起始值（这里是id=10）；通过叶子节点间的链表指针顺序遍历，直到找到范围的结束值（这里是id=20）。

1.4 聚簇索引与非聚簇索引

在InnoDB存储引擎中，B+Tree索引分为聚簇索引（clustered index）和非聚簇索引（secondary index）：

聚簇索引是指数据行与主键索引存储在一起，叶子节点直接包含完整的数据记录。一个表只能有一个聚簇索引，InnoDB存储引擎默认使用主键作为聚簇索引。如果没有定义主键，InnoDB会选择一个唯一的非空索引代替；如果没有这样的索引，InnoDB会隐式定义一个主键作为聚簇索引。

非聚簇索引（也称为二级索引或辅助索引）的叶子节点不包含完整的数据记录，而是包含索引键值和指向数据行的指针（在InnoDB中是主键值）。使用非聚簇索引查询时，如果需要获取索引键以外的数据，需要进行"回表"操作，即先通过索引找到主键值，再通过主键值查找完整的数据行。

这种设计使得InnoDB在主键查询上性能极佳，但在二级索引查询上可能需要额外的I/O操作。因此，在设计表结构时，选择合适的主键和索引是非常重要的。

2. Hash索引

Hash索引基于哈希表实现，只有精确匹配索引所有列的查询才有效。Hash索引的特点是查询速度极快，但功能相对有限。

2.1 Hash索引的特点

Hash索引的最大特点是查询速度极快。理论上，Hash索引只需一次索引检索就可以找到对应的数据行，时间复杂度为O(1)。这使得Hash索引在等值查询（如WHERE column = value）场景下性能优异。

然而，Hash索引也有明显的局限性。首先，Hash索引只支持等值比较，即只支持=和IN操作符，不支持范围查询（如>、<、BETWEEN等）。其次，Hash索引不支持排序，因为Hash值与原始数据的大小顺序无关，因此无法用于ORDER BY操作。此外，Hash索引不支持部分索引列匹配，如果索引包含多列，必须使用全部索引列进行查询才能使用Hash索引。

2.2 Hash索引的应用场景

尽管有这些限制，Hash索引在特定场景下仍然非常有用：

MySQL的Memory存储引擎显式支持Hash索引，同时也支持B-Tree索引。在内存表中，如果只需要进行等值查询，Hash索引通常是更好的选择。
InnoDB存储引擎虽然不支持显式的Hash索引，但提供了一种称为"自适应Hash索引"的功能。InnoDB会监控对表上各索引页的查询，如果观察到建立Hash索引可以带来速度提升，则自动在内存中建立Hash索引。这种机制结合了B+Tree和Hash索引的优点，能够在不同的查询场景下提供良好的性能。

在实际应用中，如果查询模式主要是等值查询，且不需要范围查询和排序，可以考虑使用Hash索引或选择支持Hash索引的存储引擎。

3. 全文索引（Full-Text Index）

全文索引是一种特殊类型的索引，用于全文搜索。与B-Tree索引不同，它查找的是文本中的关键词，而不是直接比较索引中的值。全文索引适用于需要在大文本字段中进行关键词搜索的场景。

3.1 全文索引的特点

全文索引的主要特点是支持复杂的文本搜索。它可以根据关键词的相关性对结果进行排序，使得搜索结果更加符合用户的期望。全文索引适用于CHAR、VARCHAR、TEXT类型的字段，这些字段通常包含大量的文本内容。

MySQL的全文索引支持两种搜索模式：自然语言模式和布尔模式。自然语言模式下，搜索结果按照相关性排序；布尔模式下，可以使用特殊的操作符（如+、-、*等）进行更复杂的查询，如指定必须包含或排除某些词语。

3.2 全文索引的限制

全文索引也有一些限制需要注意。在MySQL 5.6之前，只有MyISAM存储引擎支持全文索引；MySQL 5.6及以后版本，InnoDB也开始支持全文索引。此外，MySQL默认的全文解析器对中文支持不佳，因为它以空格作为词语的分隔符，而中文通常没有明显的分隔符。对于中文全文搜索，可能需要使用第三方解析器如ngram，或者使用专门的全文搜索引擎如Elasticsearch。

在性能方面，对于大规模的全文搜索需求，专业的全文搜索引擎通常是更好的选择。这些引擎提供了更丰富的功能和更好的性能，特别是在处理大量文本数据时。

4. 空间索引（R-Tree）

空间索引是用于地理空间数据类型的索引，如GEOMETRY类型。MySQL使用R-Tree索引算法来优化对空间数据的查询，支持包含、相交、距离等空间关系查询。

4.1 R-Tree索引的特点

R-Tree索引的主要特点是支持空间数据查询。它可以高效地进行包含、相交、距离等空间关系查询，这在地理信息系统（GIS）应用中非常有用。R-Tree是一种多维数据索引，适用于多维数据的存储和检索，如二维平面上的点、线、多边形等。

在MySQL中，MyISAM存储引擎一直支持空间索引，而InnoDB从MySQL 5.7版本开始也支持空间索引。这使得开发者可以在事务安全的环境中使用空间数据和空间索引。

4.2 空间索引的应用场景

空间索引主要应用于需要处理地理空间数据的场景，如：

地图应用：查找某个区域内的所有点、线、面等地理要素
位置服务：查找距离某个点一定范围内的所有对象
路径规划：查找两点之间的最短路径
区域分析：分析某个区域内的地理数据分布

在这些场景中，空间索引可以大大提高查询效率，使得复杂的空间关系查询变得可行。

5. 索引数据结构的选择

不同的索引数据结构适用于不同的查询场景，选择合适的索引类型对于优化查询性能至关重要。

B+Tree索引：最通用的索引类型，适用于大多数查询场景，特别是范围查询和排序操作。由于B+Tree索引在各种查询场景下都有良好的性能表现，它是MySQL中最常用的索引类型。

Hash索引：适用于只有等值查询的场景，如缓存系统。在这种场景下，Hash索引的查询速度通常比B+Tree索引更快。但如果需要范围查询或排序，Hash索引就不适用了。

全文索引：适用于全文搜索场景，如文章搜索、内容检索。如果需要在大文本字段中进行关键词搜索，全文索引是最佳选择。

空间索引：适用于地理空间数据查询，如地图应用。如果需要进行空间关系查询，空间索引可以提供高效的查询性能。

在实际应用中，需要根据具体的查询需求和数据特点选择合适的索引类型。有时候，可能需要为同一个表创建多种类型的索引，以满足不同的查询需求。

三、MySQL索引使用方法与最佳实践

了解了索引的基本概念和类型后，接下来我们将深入探讨如何在实际应用中创建和使用索引，以及一些最佳实践。

1. 创建索引的语法

在MySQL中，有多种方式可以创建索引，下面介绍几种常用的索引创建语法。

1.1 创建表时定义索引

在创建表的同时定义索引是最直接的方式。这种方式适用于新建表的情况，可以在CREATE TABLE语句中直接指定索引。

CREATE TABLE users (
    id INT PRIMARY KEY AUTO_INCREMENT,
    name VARCHAR(50),
    email VARCHAR(100),
    age INT,
    INDEX idx_name (name),
    INDEX idx_name_age (name, age)
);

在上面的例子中，我们创建了一个users表，并定义了三个索引：主键索引id、普通索引idx_name（单列索引）和idx_name_age（复合索引）。

1.2 在已有表上创建索引

对于已经存在的表，可以使用CREATE INDEX或ALTER TABLE语句来添加索引。

使用CREATE INDEX语句：

CREATE INDEX idx_email ON users (email);
CREATE UNIQUE INDEX idx_unique_email ON users (email);

使用ALTER TABLE语句：

ALTER TABLE users ADD INDEX idx_age (age);

这两种方式的效果是相同的，都可以在已有表上创建索引。CREATE INDEX语句更加直观，而ALTER TABLE语句则更加通用，因为它还可以进行其他表结构的修改。

1.3 创建特殊类型的索引

除了普通索引外，MySQL还支持创建多种特殊类型的索引：

创建主键索引：

ALTER TABLE table_name ADD PRIMARY KEY (column);

创建唯一索引：

CREATE UNIQUE INDEX index_name ON table_name (column);

创建全文索引：

CREATE FULLTEXT INDEX index_name ON table_name (column);

创建空间索引：

CREATE SPATIAL INDEX index_name ON table_name (column);

这些特殊类型的索引各有其用途，应根据具体需求选择合适的索引类型。

1.4 删除索引

当索引不再需要时，可以使用DROP INDEX或ALTER TABLE语句删除索引：

使用DROP INDEX语句：

DROP INDEX index_name ON table_name;

使用ALTER TABLE语句：

ALTER TABLE table_name DROP INDEX index_name;

删除主键索引：

ALTER TABLE table_name DROP PRIMARY KEY;

删除不必要的索引可以减少存储空间的占用，并提高数据修改操作的性能。

2. 索引选择策略

选择合适的索引对于数据库性能至关重要。以下是一些索引选择的策略：

2.1 选择高区分度的列作为索引

区分度是指列中不同值的数量与表中记录总数的比值，即count(distinct column) / count(*)。区分度越高，索引的效率越高。

主键和唯一键通常具有很高的区分度，是理想的索引候选。相反，状态字段、性别字段等低区分度的列不适合单独建立索引，因为即使使用索引，也需要扫描大量的数据。

一般来说，区分度在0.1以上的列才适合建立索引。可以通过以下SQL语句计算列的区分度：

SELECT COUNT(DISTINCT column_name) / COUNT(*) FROM table_name;

2.2 频繁作为查询条件的列应建立索引

索引的主要目的是加速查询，因此应该为经常出现在查询条件中的列创建索引。这包括：

经常出现在WHERE子句中的列
经常用于连接的列（外键关系）
经常出现在ORDER BY、GROUP BY、DISTINCT中的列

通过分析应用程序的查询模式，可以确定哪些列是频繁使用的，从而为这些列创建合适的索引。

2.3 避免冗余和重复索引

索引虽然可以提高查询性能，但也会占用存储空间并降低写入性能。因此，应该避免创建冗余和重复的索引。

不要在同一列上创建多个索引。例如，如果已经有了一个包含列A的索引，就不需要再为列A单独创建另一个索引。

对于联合索引(a,b)，不需要再单独为a列创建索引，因为联合索引的最左前缀可以被用作单列索引。但是，如果经常需要单独查询b列，则可能需要为b列创建单独的索引。

定期检查和删除不再使用的索引，可以通过查询系统表或使用工具来分析索引的使用情况。

2.4 考虑索引的维护成本

创建索引不仅仅是考虑查询性能，还需要考虑索引的维护成本。

索引会占用磁盘空间，索引越多，所需的存储空间就越大。在大型数据库中，这可能是一个重要的考虑因素。

增删改操作会导致索引的维护，影响写入性能。每次插入、更新或删除数据时，数据库需要更新相关的索引，这会增加操作的开销。在写入密集的应用中，过多的索引可能会成为性能瓶颈。

索引数量过多会增加优化器的选择时间。MySQL的查询优化器需要决定使用哪个索引，索引越多，决策过程就越复杂，可能会增加查询的前期开销。

3. 复合索引和最左前缀原则

复合索引（也称为联合索引或多列索引）是在多个列上创建的索引。复合索引的使用需要遵循最左前缀原则，这是MySQL索引使用的一个重要规则。

3.1 复合索引概述

复合索引是在多个列上创建的索引，其结构是按照索引列的顺序构建的B+树。复合索引的创建语法如下：

CREATE INDEX idx_name_age_city ON users (name, age, city);

这将创建一个包含name、age和city三列的复合索引。复合索引的优点是可以在多个列上提供索引支持，减少索引的数量，并且可以覆盖更多的查询场景。

3.2 最左前缀原则

最左前缀原则是MySQL中使用复合索引的重要原则，具体来说：

在MySQL建立联合索引时会遵守最左前缀匹配原则，即最左优先，在检索数据时从联合索引的最左边开始匹配。如果创建了复合索引(col1, col2, col3)，则相当于创建了(col1)、(col1, col2)和(col1, col2, col3)三个索引。

查询条件中必须包含复合索引的第一列，才能使用该索引。例如，对于索引INDEX(a, b, c)，以下查询可以使用索引：

WHERE a = 1 AND b = 2 AND c = 3：使用索引的所有列
WHERE a = 1 AND b = 2：使用索引的前两列
WHERE a = 1：只使用索引的第一列
WHERE b = 2 AND a = 1：MySQL的查询优化器会调整条件顺序，使用索引的前两列

而以下查询无法使用索引：

WHERE b = 2 AND c = 3：缺少索引的第一列
WHERE c = 3：缺少索引的第一列和第二列

这种行为的原理在于B+树的数据结构。B+树是按照索引列的顺序构建的，如果缺少最左边的列，就无法确定从哪个节点开始查找。

3.3 最左前缀原则的注意事项

在使用复合索引时，需要注意以下几点：

范围查询的影响：MySQL会一直向右匹配直到遇到范围查询（>、<、BETWEEN、LIKE）就停止匹配。范围列可以用到索引，但范围列后面的列无法用到索引。例如，对于索引(a,b,c)，查询条件WHERE a = 1 AND b > 2 AND c = 3，只能用到a和b列的索引，c列无法使用。
LIKE语句的索引使用：如果通配符%不出现在开头，则可以用到索引。LIKE 'value%'可以使用索引，但LIKE '%value%'不会使用索引，会导致全表扫描。
避免在索引列上进行运算：在索引列上进行函数运算会导致索引失效。例如，WHERE YEAR(birthday) < 1990应改为WHERE birthday < '1990-01-01'。
NULL值的影响：包含NULL值的列可能不会被包含在索引中。在复合索引中，如果有一列含有NULL值，那么这一列对于此复合索引可能是无效的。建议在设计数据库时不要让字段的默认值为NULL。

4. 索引覆盖和索引下推

索引覆盖和索引下推是MySQL中两种重要的索引优化技术，可以显著提高查询性能。

4.1 索引覆盖

索引覆盖是指查询的数据列刚好是索引的一部分，这样就不需要回表查询实际的数据行。当一个索引包含（或者说覆盖）所有需要查询的字段的值，我们就称之为"覆盖索引"。

索引覆盖的主要优势在于避免了回表操作，减少了IO次数。由于索引通常比数据行小，可以减少数据访问量，从而提高查询效率。

例如，假设有表结构：

CREATE TABLE users (
  id INT PRIMARY KEY,
  name VARCHAR(50),
  age INT,
  INDEX idx_name_age (name, age)
);

对于查询：

SELECT name, age FROM users WHERE name = 'John';

这个查询可以直接从索引idx_name_age中获取所需的name和age值，无需回表查询，因此是一个索引覆盖的例子。

在EXPLAIN结果中，如果Extra列包含"Using index"，表示查询使用了索引覆盖。

4.2 索引下推

索引下推（Index Condition Pushdown, ICP）是MySQL 5.6版本引入的一种优化技术。在索引遍历过程中，对索引中包含的字段先做判断，过滤掉不符合条件的记录，减少回表次数。

不使用ICP时，存储引擎通过索引检索到数据，然后返回给MySQL服务器，服务器再进行WHERE条件过滤。使用ICP时，如果WHERE条件的一部分可以通过索引列检查，存储引擎会在索引内部就进行数据过滤，然后返回过滤后的数据给MySQL服务器。

索引下推只能用于二级索引（非主键索引），WHERE条件中有针对索引列的条件，且查询是范围查询或者包含多个等值条件。

例如，假设有表和索引：

CREATE TABLE people (
  id INT PRIMARY KEY,
  name VARCHAR(50),
  age INT,
  city VARCHAR(50),
  INDEX idx_name_city (name, city)
);

对于查询：

SELECT * FROM people WHERE name LIKE 'J%' AND city = 'New York';

使用ICP时，存储引擎会在索引中过滤掉city不是’New York’的记录，只对符合条件的记录进行回表操作，从而减少了回表次数，提高了查询效率。

在EXPLAIN结果中，如果Extra列包含"Using index condition"，表示查询使用了索引下推。

5. 索引使用的最佳实践

基于前面的讨论，以下是一些索引使用的最佳实践：

5.1 合理设计索引

为经常需要搜索、排序、分组的列创建索引。这些操作通常是数据库查询中的性能瓶颈，合适的索引可以显著提高这些操作的效率。

考虑查询的频率和性能要求。对于频繁执行的查询，应该优先考虑创建索引；对于性能要求高的查询，即使执行频率不高，也可能需要创建索引。

在复合索引中，将选择性高的列放在前面。这样可以在索引的早期阶段就过滤掉大量不符合条件的记录，提高查询效率。

5.2 避免过度索引

索引会占用存储空间，过多的索引会增加存储成本。在大型数据库中，索引可能占用相当大的存储空间。

索引会降低写入性能。每次插入、更新或删除数据时，数据库需要更新相关的索引，索引越多，写入操作的开销就越大。

定期检查和删除不再使用的索引。可以通过查询系统表或使用工具来分析索引的使用情况，删除那些不再使用或使用频率很低的索引。

5.3 利用EXPLAIN分析查询

使用EXPLAIN命令分析SQL查询的执行计划。EXPLAIN可以显示MySQL如何处理SQL语句，包括使用哪些索引、扫描多少行等信息。

检查索引的使用情况和查询效率。通过EXPLAIN的结果，可以判断索引是否被正确使用，以及查询的效率如何。

根据分析结果优化索引和查询。如果发现索引没有被使用，或者查询效率不高，可以考虑调整索引设计或优化查询语句。

5.4 避免索引失效的情况

不在索引列上使用函数或表达式。例如，WHERE YEAR(date_column) = 2023会导致索引失效，应改为WHERE date_column BETWEEN '2023-01-01' AND '2023-12-31'。
避免在索引列上进行类型转换。确保查询条件中的数据类型与索引列的数据类型一致，避免隐式类型转换导致索引失效。
避免使用NOT IN、NOT EXISTS等否定条件。这些条件通常会导致全表扫描，可以考虑使用其他方式重写查询。
避免使用OR连接多个条件。OR条件通常会导致索引失效，可以考虑使用UNION ALL代替。

5.5 合理使用前缀索引

对于长字符串列，可以只索引开头的一部分字符，这称为前缀索引。前缀索引可以减少索引的大小，提高索引的效率。

通过计算前缀的选择性来确定合适的前缀长度。前缀长度应该足够长，以保持良好的选择性，但又不要太长，以减少索引的大小。

例如，可以使用以下语法创建前缀索引：

CREATE INDEX idx_name ON table_name (column_name(10));

这将为column_name列的前10个字符创建索引。

5.6 定期维护索引

定期进行表的ANALYZE操作，更新索引统计信息。MySQL使用统计信息来决定使用哪个索引，如果统计信息不准确，可能会导致次优的执行计划。

对于频繁更新的表，考虑定期重建索引。长时间的增删改操作可能导致索引碎片，重建索引可以减少碎片，提高索引的效率。

监控索引的使用情况和性能表现。通过监控工具或查询系统表，可以了解索引的使用情况和性能表现，及时发现和解决问题。

四、MySQL索引优化与实际案例分析

在前面的章节中，我们已经了解了MySQL索引的基本概念、类型、使用方法和最佳实践。在本章中，我们将深入探讨如何分析和优化索引性能，以及一些实际的优化案例。

1. 索引性能分析

索引性能分析是优化数据库性能的重要步骤。通过分析索引的使用情况和查询的执行计划，可以找出性能瓶颈并进行针对性的优化。

1.1 慢查询日志分析

慢查询日志是MySQL提供的一种日志记录，用于记录执行时间超过指定阈值的SQL语句。通过分析慢查询日志，可以找出性能较差的查询，并进行优化。

开启慢查询日志的方法如下：

-- 开启慢查询日志
SET GLOBAL slow_query_log = ON;

-- 设置慢查询阈值，单位为秒，这里设置为0.5秒
SET GLOBAL long_query_time = 0.5;

-- 查看慢查询日志文件位置
SHOW GLOBAL VARIABLES LIKE 'slow_query_log_file';

-- 查看慢查询相关配置
SHOW GLOBAL VARIABLES LIKE '%quer%';

开启慢查询日志后，MySQL会将执行时间超过long_query_time的SQL语句记录到慢查询日志文件中。可以通过以下方式分析慢查询日志：

直接查看日志文件：查看slow_query_log_file指定的文件内容，可以看到每条慢查询的详细信息，包括执行时间、扫描行数、锁定时间等。

使用mysqldumpslow工具：MySQL提供的日志分析工具，可以统计慢查询的执行次数、平均执行时间等信息。例如：

# 查看执行时间最长的10条SQL
mysqldumpslow -t 10 /var/lib/mysql/slow-query.log

# 查看执行次数最多的10条SQL
mysqldumpslow -s c -t 10 /var/lib/mysql/slow-query.log

使用pt-query-digest工具：Percona工具集中的慢查询分析工具，提供了更详细的分析报告，包括查询的指纹、执行次数、总执行时间、平均执行时间等信息。例如：

pt-query-digest /var/lib/mysql/slow-query.log

通过分析慢查询日志，可以找出执行时间长的SQL语句，然后针对这些语句进行优化，如添加合适的索引、优化查询语句等。

1.2 使用EXPLAIN分析查询执行计划

EXPLAIN命令是MySQL提供的用于分析SQL语句执行计划的工具，可以帮助我们了解MySQL如何处理SQL语句，从而优化查询性能。

EXPLAIN的基本用法非常简单，只需在SQL语句前加上EXPLAIN关键字：

EXPLAIN SELECT * FROM users WHERE username = 'john';

EXPLAIN的结果包含多个字段，其中最重要的几个字段是：

id：SELECT查询的序列号，表示查询中执行SELECT子句或操作表的顺序。
select_type：SELECT的类型，常见的有SIMPLE（简单查询）、PRIMARY（包含子查询的主查询）、SUBQUERY（子查询）、DERIVED（派生表）等。
table：查询涉及的表名。
type：访问类型，按性能从好到差排序：system > const > eq_ref > ref > range > index > ALL。其中，system和const表示通过索引一次就能找到数据；eq_ref表示使用唯一索引扫描；ref表示使用非唯一索引扫描；range表示索引范围扫描；index表示全索引扫描；ALL表示全表扫描，性能最差。
possible_keys：可能使用的索引。
key：实际使用的索引。
key_len：使用的索引长度。
ref：与索引比较的列。
rows：预计需要扫描的行数。
Extra：额外信息，如"Using index"（覆盖索引）、“Using where”（需要后过滤）、“Using temporary”（使用临时表）、“Using filesort”（需要额外排序）等。

通过分析EXPLAIN的结果，可以判断索引是否被正确使用，以及查询的效率如何。如果type字段显示为ALL，表示进行了全表扫描，可能需要添加合适的索引；如果Extra字段包含"Using filesort"或"Using temporary"，表示查询需要额外的排序或临时表，可能需要优化查询或添加合适的索引。

1.3 使用性能分析工具

除了MySQL自带的工具外，还可以使用以下工具进行性能分析：

MySQL Performance Schema：MySQL内置的性能收集工具，可以收集服务器事件的详细信息，如SQL语句的执行情况、锁等待、文件I/O等。例如：

-- 开启Performance Schema
SET GLOBAL performance_schema = ON;

-- 查看SQL语句的执行情况
SELECT * FROM performance_schema.events_statements_summary_by_digest
ORDER BY sum_timer_wait DESC LIMIT 10;

MySQL Workbench：MySQL官方提供的图形化工具，包含性能分析功能，如性能仪表盘、查询分析器等。

Percona Monitoring and Management (PMM)：开源的MySQL监控和管理平台，提供了全面的性能监控和分析功能，包括查询分析、索引使用情况、资源使用情况等。

这些工具可以帮助我们全面了解数据库的性能状况，找出性能瓶颈，并进行针对性的优化。

2. 常见索引问题及解决方案

在实际应用中，我们经常会遇到各种索引相关的问题。下面介绍一些常见的索引问题及其解决方案。

2.1 索引失效的情况

索引失效是指虽然创建了索引，但在查询时索引没有被使用，导致查询效率低下。常见的索引失效情况包括：

隐式类型转换导致索引失效：当查询条件中的数据类型与索引列的数据类型不匹配时，MySQL会进行隐式类型转换，导致索引失效。

例如，如果user_id是VARCHAR类型，但在查询时使用数字：

-- 不走索引的查询（隐式转换）
EXPLAIN SELECT * FROM user WHERE user_id = 123;

-- 走索引的查询
EXPLAIN SELECT * FROM user WHERE user_id = '123';

解决方案是确保查询条件中的数据类型与索引列的数据类型一致，或者在SQL语句中显式进行类型转换。

最左前缀原则失效：在复合索引中，如果查询条件不满足最左前缀原则，索引可能会失效。

例如，对于索引idx_userid_name (user_id, name)：

-- 不走索引的查询（不满足最左前缀原则）
EXPLAIN SELECT * FROM user WHERE name = 'John';

-- 走索引的查询
EXPLAIN SELECT * FROM user WHERE user_id = '123' AND name = 'John';
EXPLAIN SELECT * FROM user WHERE user_id = '123';

解决方案是调整查询条件，确保包含复合索引的第一列；或者根据查询需求调整索引顺序；或者为经常单独查询的列创建单独的索引。

范围查询后的列索引失效：在复合索引中，如果查询条件中包含范围查询（如>、<、BETWEEN、LIKE），则范围查询后的列索引会失效。

例如，对于索引idx_userid_age_name (user_id, age, name)：

-- name列索引失效的查询
EXPLAIN SELECT * FROM user WHERE user_id = '123' AND age > 20 AND name = 'John';

解决方案是调整索引顺序，将范围查询的列放在复合索引的最后；或者为范围查询后的列创建单独的索引；或者使用覆盖索引优化查询。

2.2 深分页问题

当使用LIMIT进行深分页查询时，MySQL需要先扫描并丢弃大量数据，导致查询性能下降。

例如：

-- 深分页查询（性能差）
SELECT id, name, balance FROM account WHERE create_time > '2022-11-7' LIMIT 100000, 10;

这个查询需要扫描100010行数据，然后丢弃前100000行，只返回后10行，效率非常低。

解决方案有两种：

标签记录法：记录上次查询的位置，下次从该位置开始查询。例如：

-- 假设上次查询到id为100000的记录
SELECT id, name, balance FROM account WHERE id > 100000 LIMIT 10;

这种方法需要一个连续自增的字段（如主键id），并且需要记录上次查询的位置。

延迟关联法：先通过索引获取主键ID，再关联原表获取数据。例如：

SELECT a1.id, a1.name, a1.balance 
FROM account a1 
INNER JOIN (
  SELECT id FROM account 
  WHERE create_time > '2022-11-7' 
  LIMIT 100000, 10
) AS a2 
ON a1.id = a2.id;

这种方法先通过索引快速定位到需要的主键ID，然后再通过主键ID获取完整的数据行，避免了大量的回表操作。

2.3 IN子句包含大量值

当IN子句中包含大量值时，MySQL的查询优化器可能无法正确评估查询成本，导致选择次优的执行计划。

例如：

-- IN子句包含大量值的查询
SELECT * FROM user WHERE user_id IN (值1, 值2, ..., 值1000);

解决方案包括：

将IN子句中的值分批处理，每批不超过200个值。例如，将上面的查询拆分为多个查询，每个查询的IN子句中包含不超过200个值。

使用临时表存储IN子句中的值，然后使用JOIN查询。例如：

-- 创建临时表
CREATE TEMPORARY TABLE temp_ids (id VARCHAR(32));
-- 插入值
INSERT INTO temp_ids VALUES ('值1'), ('值2'), ..., ('值1000');
-- 使用JOIN查询
SELECT u.* FROM user u JOIN temp_ids t ON u.user_id = t.id;

调整MySQL参数eq_range_index_dive_limit（默认为200）。这个参数控制优化器对IN子句中值的数量的阈值，超过这个阈值后，优化器会使用统计信息而不是索引来评估查询成本。

2.4 ORDER BY导致文件排序

当ORDER BY子句中的列没有合适的索引时，MySQL需要进行文件排序，影响查询性能。

例如：

-- 需要文件排序的查询
EXPLAIN SELECT * FROM staff ORDER BY age, name;

如果age和name列没有合适的索引，MySQL会使用文件排序，这在大数据量的情况下会非常耗时。

解决方案包括：

为ORDER BY子句中的列创建合适的索引。例如：

CREATE INDEX idx_age_name ON staff (age, name);

如果ORDER BY子句中的列与WHERE子句中的列一致，可以利用索引的排序特性。例如：

-- 利用索引的排序特性
SELECT * FROM staff WHERE age > 20 ORDER BY age;

如果不需要排序，可以使用ORDER BY NULL禁用排序。例如：

-- 禁用排序
SELECT COUNT(*) FROM staff GROUP BY age ORDER BY NULL;

限制返回的结果集大小，减少排序的数据量。例如：

-- 限制结果集大小
SELECT * FROM staff ORDER BY age, name LIMIT 100;

3. 实际优化案例分析

下面通过几个实际的优化案例，展示如何分析和优化索引性能。

3.1 案例1：优化复杂JOIN查询

问题描述：一个包含多表JOIN的复杂查询，执行时间超过10秒。

原始查询：

SELECT o.order_id, o.order_date, c.customer_name, p.product_name, od.quantity, od.price
FROM orders o
JOIN order_details od ON o.order_id = od.order_id
JOIN customers c ON o.customer_id = c.customer_id
JOIN products p ON od.product_id = p.product_id
WHERE o.order_date BETWEEN '2022-01-01' AND '2022-12-31'
ORDER BY o.order_date DESC;

问题分析：

EXPLAIN分析显示多个表的连接类型为ALL（全表扫描）
orders表的order_date列没有索引
ORDER BY子句导致文件排序

优化方案：

为orders表的order_date列添加索引

ALTER TABLE orders ADD INDEX idx_order_date (order_date);

确保所有JOIN条件的列都有索引

ALTER TABLE order_details ADD INDEX idx_order_id (order_id);
ALTER TABLE order_details ADD INDEX idx_product_id (product_id);

使用覆盖索引优化查询

-- 为经常查询的列创建复合索引
ALTER TABLE orders ADD INDEX idx_order_date_customer_id (order_date, customer_id);

优化结果：查询执行时间从10秒降至0.3秒，性能提升约33倍。

这个案例展示了如何通过添加合适的索引来优化复杂的JOIN查询。通过为WHERE条件、JOIN条件和ORDER BY子句中的列创建索引，可以显著提高查询性能。

3.2 案例2：优化GROUP BY查询

问题描述：一个包含GROUP BY和聚合函数的查询，执行时间超过5秒。

原始查询：

SELECT product_category, COUNT(*) as count, SUM(sales_amount) as total_sales
FROM sales
WHERE sale_date BETWEEN '2022-01-01' AND '2022-12-31'
GROUP BY product_category
ORDER BY total_sales DESC;

问题分析：

EXPLAIN分析显示使用了临时表和文件排序
sales表的product_category列没有索引
sale_date列没有索引

优化方案：

为sale_date列添加索引

ALTER TABLE sales ADD INDEX idx_sale_date (sale_date);

为GROUP BY子句中的列添加索引

ALTER TABLE sales ADD INDEX idx_product_category (product_category);

创建复合索引优化查询

ALTER TABLE sales ADD INDEX idx_date_category (sale_date, product_category);

使用SQL_BIG_RESULT提示优化器使用磁盘临时表

SELECT SQL_BIG_RESULT product_category, COUNT(*) as count, SUM(sales_amount) as total_sales
FROM sales
WHERE sale_date BETWEEN '2022-01-01' AND '2022-12-31'
GROUP BY product_category
ORDER BY total_sales DESC;

优化结果：查询执行时间从5秒降至0.8秒，性能提升约6倍。

这个案例展示了如何优化GROUP BY查询。通过为WHERE条件和GROUP BY子句中的列创建索引，以及使用SQL_BIG_RESULT提示，可以显著提高GROUP BY查询的性能。

3.3 案例3：优化子查询

问题描述：一个包含子查询的SQL语句，执行时间超过8秒。

原始查询：

SELECT u.user_id, u.username, u.email
FROM users u
WHERE u.user_id IN (
  SELECT o.user_id
  FROM orders o
  WHERE o.order_amount > 1000
  AND o.order_date > '2022-01-01'
);

问题分析：

EXPLAIN分析显示子查询被优化为semi-join，但效率不高
orders表的user_id列没有索引
orders表的order_date列没有索引

优化方案：

为子查询中的条件列添加索引

ALTER TABLE orders ADD INDEX idx_user_id (user_id);
ALTER TABLE orders ADD INDEX idx_order_date (order_date);
ALTER TABLE orders ADD INDEX idx_order_amount (order_amount);

将子查询改写为JOIN

SELECT DISTINCT u.user_id, u.username, u.email
FROM users u
JOIN orders o ON u.user_id = o.user_id
WHERE o.order_amount > 1000
AND o.order_date > '2022-01-01';

创建复合索引进一步优化

ALTER TABLE orders ADD INDEX idx_user_amount_date (user_id, order_amount, order_date);

优化结果：查询执行时间从8秒降至0.5秒，性能提升约16倍。

这个案例展示了如何优化子查询。通过为子查询中的条件列创建索引，将子查询改写为JOIN，以及创建复合索引，可以显著提高子查询的性能。

4. 索引优化的最佳实践总结

基于前面的讨论和案例分析，以下是一些索引优化的最佳实践：

定期分析慢查询日志：开启慢查询日志，定期分析并优化慢查询。慢查询日志可以帮助我们找出性能较差的查询，为优化工作提供方向。
使用EXPLAIN分析查询计划：在编写SQL语句时使用EXPLAIN分析执行计划，确保索引被正确使用。EXPLAIN可以帮助我们了解MySQL如何处理SQL语句，从而优化查询性能。
合理设计索引：为WHERE、JOIN、ORDER BY、GROUP BY子句中的列创建索引；在复合索引中，将选择性高的列放在前面；考虑查询频率和性能要求，避免过度索引。
避免索引失效：避免在索引列上使用函数或表达式；避免隐式类型转换；遵循最左前缀原则；注意范围查询对复合索引的影响。
优化查询语句：只查询需要的列，避免SELECT *；限制结果集大小，使用LIMIT；使用覆盖索引减少回表操作；将复杂查询拆分为简单查询。
定期维护索引：定期分析表结构和查询模式的变化；删除不再使用的索引；使用ANALYZE TABLE更新索引统计信息。
监控索引使用情况：使用Performance Schema监控索引使用情况；关注索引的命中率和效率；根据监控结果调整索引策略。

通过遵循这些最佳实践，可以确保索引被正确使用，提高查询性能，优化数据库系统的整体效率。

总结

本文从开发工程师的角度出发，由浅入深地全面解析了MySQL索引的原理、类型、使用方法、优化技巧以及实际应用案例。首先介绍了索引的基本概念和原理，包括索引的定义、作用、基本原理以及优缺点；然后详细讨论了MySQL支持的各种索引类型及其底层数据结构，如B-Tree索引、Hash索引、全文索引和空间索引；接着探讨了索引的使用方法和最佳实践，包括创建索引的语法、索引选择策略、复合索引和最左前缀原则、索引覆盖和索引下推等；最后通过实际案例分析了如何优化索引性能，包括索引性能分析、常见索引问题及解决方案、实际优化案例等。

需要强调的是，索引优化是一个持续的过程，需要根据实际的业务场景和数据特点不断调整和优化。

你可能感兴趣的:(mysql,mysql,数据库,java)

移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
深入解析JVM工作原理：从字节码到机器指令的全过程
一、JVM概述Java虚拟机(JVM)是Java平台的核心组件，它实现了Java"一次编写，到处运行"的理念。JVM是一个抽象的计算机器，它有自己的指令集和运行时内存管理机制。JVM的主要职责：加载：读取.class文件并验证其正确性存储：管理内存分配和垃圾回收执行：解释或编译字节码为机器指令安全：提供沙箱环境限制恶意代码二、JVM架构详解JVM由三个主要子系统组成：1.类加载子系统类加载过程分为
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
Java | 多线程经典问题 - 售票 Ada54
一、售票需求1）同一个票池2）多个窗口卖票，不能出售同一张票二、售票问题代码实现（线程与进程小总结，请戳：Java|线程和进程，创建线程）step1：定义SaleWindow类实现Runnable接口，覆盖run方法step2：实例化SaleWindow对象，创建Thread对象，将SaleWindow作为参数传给Thread类的构造函数，然后通过Thread.start()方法启动线程step3
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
在线人数统计业务设计（场景八股文）
业务问题在当经的网站中，在线人数的实时统计已经是一个必不可少的模块了，并且该统计功能最好能够按不同的时间间隔做的统计，现在需要你设计一个在线人数统计的模块，你应该怎么进行设计的呢？背景一个网校下会有多个学员。目前平台大概有十个，平台对应的网校大概五十几个，平均一个网校会有5w个用户，预计总人数为200w，最该学员的在线人数在10w左右。设计思路最开始的时候，想到的就是使用mysql直接实现，但是明
JAVA接口机结构解析秃狼 SpringBoot 八股文 Java java 学习
什么是接口机在Java项目中，接口机通常指用于与外部系统进行数据交互的中间层，负责处理请求和响应的转换、协议适配、数据格式转换等任务。接口机的结构我们的接口机的结构分为两个大部分，外部接口机和内部接口机，在业务的调度上也是通过mq来实现的，只要的目的就是为了解耦合和做差异化。在接口机中主要的方法就是定时任务，消息的发送和消费，其他平台调用接口机只能提供外部接口机的方法进行调用，外部接口机可以提供消
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
Java 队列 tryxr java 开发语言队列
队列一般用什么哪种结构实现队列的特性数据入队列时一定是从尾部插入吗数据出队列时一定是从头部删除吗队列的基本运算有什么队列支持随机访问吗队列的英文表示什么是队列队列从哪进、从哪出队列的进出顺序队列是用哪种结构实现的Queue和Deque有什么区别Queue接口的方法Queue中的add与offer的区别offer、poll、peek的模拟实现如何利用链表实现队列如何利用顺序表实现队列什么叫做双端队列
JVM 内存分配与回收策略：从对象创建到内存释放的全流程
在JVM的运行机制中，内存分配与回收策略是连接对象生命周期与垃圾收集器的桥梁。它决定了对象在堆内存中的创建位置、存活过程中的区域迁移，以及最终被回收的时机。合理的内存分配策略能减少GC频率、降低停顿时间，是优化Java应用性能的核心环节。本文将系统解析JVM的内存分配规则、对象晋升机制，以及实战中的内存优化技巧。一、对象优先在Eden区分配：新生代的“临时缓冲区”大多数情况下，Java对象在新生代
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
mysql复习立夏的李子 mysql 数据库 database
mysqlselect语法selectfromjoinwheregroupbyhavingorderbylimit联合查询innerjoin（）leftjoin（以左表为基准，匹配右表，不匹配的返回左表，右表以null值填充）rightjoind··(去除列重复的数据)索引类型主键索引(PrimaryKey)唯一索引(Unique)常规索引(Index)全文索引(FullText)索引准则索引不是
微信公众号回调java_处理微信公众号消息回调 weixin_39607620 微信公众号回调java
1、背景在上一节中，咱们知道如何接入微信公众号，可是以后公众号会与咱们进行交互，那么微信公众号如何通知到咱们本身的服务器呢？咱们知道咱们接入的时候提供的url是GET/mp/entry，那么公众号以后产生的事件将会以POST/mp/entry发送到咱们本身的服务器上。html2、代码实现，此处仍是使用weixin-java-mp这个框架实现一、引入weixin-java-mpcom.github.
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
Java8 Stream流的sorted()的排序【正序、倒序、多字段排序】 Tony666688888 java windows 开发语言
针对集合排序，java8可以用Stream流的sorted()进行排序。示例Bean以下我们会使用这个Bean来做示例。publicclassOrder{privateStringweight;privateDoubleprice;privateStringdateStr;//忽略getter、setter、构造方法、toString}字段排序首先是比较器Comparator，形式如下：Compa
用代码生成艺术字：设计个性化海报的秘密
本文围绕“用代码生成艺术字：设计个性化海报的秘密”展开，先概述代码生成艺术字在海报设计中的独特价值，接着介绍常用的代码工具（如HTML、CSS、JavaScript等），详细阐述从构思到实现的完整流程，包括字体样式设计、动态效果添加等，还分享了提升艺术字质感的技巧及实际案例。最后总结代码生成艺术字的优势，为设计师提供打造个性化海报的实用指南，助力提升海报设计的独特性与吸引力，符合搜索引擎SEO标准
java实习生40多天有感别拿爱情当饭吃
从5月15日开始，我开始第一步步入社会，我今年大三，在一家上市互联网公司做一名实习生，主要做java后端开发。开始的时候，觉得公司的环境挺不错的，不过因为公司在CBD，所以隔壁的午饭和晚饭都要20+RMB，而且还吃不饱，这让我感觉挺郁闷的。一到下午，我就会犯困（因为饿）。因此，我又不得不买一些干粮在公司屯着。关于技术，有一个比较大的项目在需求调研当中，我们做实习生，就是辅助项目经理，测试功能，并且
Mac OSX 下的mysql数据库文件存放位置 Bruuuces mysql mac osx 位置存放
之前我的mysql的系统数据库里的表被我玩坏了，万般无奈之下只得删除所有mysql的东西重新构建数据库。按照网上搜到的内容删除后重装发现数据库没有什么变化。于是自己在每个可能存放数据库文件的目录查找，最终确认目录位置如下:使用HomeBrew安装为/usr/local/var/mysql使用官方下载的dmg镜像安装为/usr/local/mysql删除这个目录再重新安装mysql就会重新生成系统数
mac os 10.9 mysql_MAC OSX 10.9 apache php mysql 环境配置 AY05 mac os 10.9 mysql
＃终端内运行sudoapachectlstart#启动Apachesudoapachectlrestart#重启Apachesudoapachectlstop#停止Apache＃配置Apachesudovi/private/etc/apache2/httpd.conf#将里面的这一行去掉前面的##LoadModulephp5_modulelibexec/apache2/libphp5.so＃配置P
mac升级mysql_Mac OSX下的MySQL数据库升级 weixin_39801714 mac升级mysql
MacOSX下的数据库升级最麻烦的不过权限的问题.本文的MySQL的安装方式为OSX下DMG磁盘镜像的安装方式,MacPorts/Homebrew的方式大同小异.从5.6.17升级到5.7.18安装目录信息ls-al/usr/local|grepmysqllrwxr-xr-x1rootwheel30B52100:39mysql@->mysql-5.6.17-osx10.7-x86_64drwxr-
大学生入门：初识方法及其易踩坑的点
在java学习过程中，我们不难发现有很多重复使用的功能代码块，每次使用如果都要重新写一遍，岂不是很麻烦，就算是“cv”大法，感觉也不是很方便，那么，有什么办法可以解决这个问题呢？方法！java中，一段可重用的，用于执行特定功能的代码块叫做方法，它可以接收参数、返回结果，并且可以被多次使用。一、方法的基本结构[修饰符]返回值类型方法名([参数列表])[throws异常类型]{//方法体}[throw
[Ljava.lang.Object; cannot be cast to [Ljava.lang.String; 这些不会的
解释：这个错误是很常见的错误，错误的提示已经很清楚了就是java的Object数组不能转换成为String[]数组，这就说明你要转换的数组它本身是Object类型的数组，但是你却非要把它转换为String类的数组，这当然是错误的。示例：[java]viewplaincopypackagecom.dada;importjava.util.ArrayList;importjava.util.List;
【MySQL】MySQL数据库如何改名武昌库里写JAVA 面试题汇总与解析 spring boot vue.js sql java 学习
MySQL建库授权语句https://www.jianshu.com/p/2237a9649ceeMySQL数据库改名的三种方法https://www.cnblogs.com/gomysql/p/3584881.htmlMySQL安全修改数据库名几种方法https://blog.csdn.net/haiross/article/details/51282417MySQL重命名数据库https://
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。