小码农(微信公众号：码农吧)

【数据库】当面试中被问到Mysql索引优化时......

文章目录

一、前言
二、独立的列
三、前缀索引和索引选择性

3.1 含义
3.2 使用值的列表来确定前缀长度
3.3 使用完整列的选择性来确定前缀长度
3.4 创建前缀索引

四、多列索引

4.1 多列索引的含义
4.2 从多列索引到索引合并
4.3 索引合并说明现有的索引很糟糕

五、选择合适的索引列顺序

5.1 索引列顺序的引入
5.2 索引列顺序的经验法则：将选择性最高的列放到索引最前列
5.3 关于选择性和基数的经验法则的不足
5.4 小结

六、聚簇索引

6.1 含义
6.2 聚簇索引中数据分布
6.3 聚簇索引的优点
6.4 聚簇索引的缺点
6.5 聚簇索引的应用：InnoDB和 MyISAM的数据分布对比

6.5.1 MyISAM的数据分布(不支持聚簇索引)
6.5.2 InnoDB的数据分布(支持聚簇索引)
6.5.3 InnoDB和MyISAM的表存放方式

6.6 聚簇索引的应用之聚集特性：主键单调递增 VS 主键UUID

6.6.1 在 InnoDB表中按主键顺序插入行
6.6.2 在 InnoDB表中按UUID插入行
6.6.3 测试：按主键顺序插入行 VS 按UUID插入行
6.6.4 问题：为什么使用UUID作为主键插入花费的时间长且索引占用空间大？
6.6.5 使用UUID作为主键的缺点
6.6.6 小结

七、覆盖索引

7.1 含义
7.2 覆盖索引的四个优点（即整个查询仅需要扫描索引而无须回表的优点）
7.3 覆盖索引的局限
7.4 覆盖索引的应用

八、使用索引扫描来做排序

8.1 索引排序
8.2 索引既满足排序,又用于查找行
8.3 前导项为常量
8.4 使用索引排序
8.5 未使用索引排序
8.6 索引排序的应用

九、压缩(前缀压缩)索引
十、冗余和重复索引

10.1 重复索引
10.2 冗余索引
10.3 扩展已有的索引 VS 创建新索引
10.4 冗余索引和重复索引解决方法

十一、未使用的索引
十二、索引和锁
十三、索引优化技巧一览
十四、小结

一、前言

索引优化是MySQL查询性能调优的一个重要课题

索引(在 MySQL中也叫做“键(key)")是存储引擎用于快速找到记录的一种数据结构,这是索引的基本功能。索引对于良好的性能非常关键，尤其是当表中的数据量越来越大时,索引对性能的影响愈发重要,在数据量较小且负载较低时,不恰当的索引对性能的影响可能还不明显,但当数据量逐渐增大时,性能则会急剧下降。

但是,索引却经常被忽略,有时候甚至被误解,所以在实际案例中经常会遇到由糟糕索引导致的问题。索引优化应该是对查询性能优化最有效的手段了,索引能够轻易将查询性能提高几个数量级,“最优”的索引有时比一个“好的”索引性能要好两个数量级。

正确地创建和使用索引是实现高性能查询的基础,高效地选择和使用索引有很多种方式，使用哪个索引,以及如何评估选择不同索引的性能影响的技巧，则需要持续不断地学习。

二、独立的列

含义：“独立的列”是指索引列不能是表达式的一部分,也不能是函数的参数。

如果查询中的列不是独立的,则 MySQL就不会使用索引。例如,下面这个查询无法使用索引：

mysql > Select actor_id From sakila.actor WHERE actor_id + 1 =5;

我们凭肉眼很容易看出WHERE子句中的表达式其实等价于 actor_id=4,但是 MySQL无法自动解析这个方程式。这完全是用户行为,我们应该养成简化 WHERE条件的习惯,始终将索引列单独放在比较符号的一侧，一般是左侧（即要使用索引优化查询，索引列要单独放在比较符号的左侧）。

上述SQL语句改为

mysql > Select actor_id From sakila.actor WHERE actor_id = 4;

下面是另一个常见的错误：

mysql > Select ... WHERE TO_DAYS(CURRENT_DAYS) - TO_DAYS(date_col) <= 10

同样的，where子句TO_DAYS(CURRENT_DAYS) - TO_DAYS(date_col) <= 10，没有把索引列单独放在比较符号的一侧。

三、前缀索引和索引选择性

3.1 含义

前缀索引含义：有时候需要索引很长的字符列,这会让索引变得大且慢。一个策略是可以索引开始的部分字符,这样可以大大节约索引空间,从而提高索引效率,但这样也会降低索引的选择性。

索引选择性含义：索引的选择性是指,不重复的索引值(也称为基数 cardinality)和数据表的记录总数(#T)的比值,范围从1/#T到1之间。索引的选择性越高则查询效率越高,因为选择性高的索引可以让 MySQL在查找时过滤掉更多的行。唯一索引的选择性是1,这是最好的索引选择性,性能也是最好的。

一般情况下某个列前缀的选择性也是足够高的,足以满足查询性能。对于BLOB、TEXT或者很长的 VARCHAR类型的列,必须使用前缀索引,因为 MySQL不允许素引这些列的完整长度。

块窍在于前缀长度要适中：要选择足够长的前缀以保证较高的选择性,同时又不能太长(以便节约空间)。前缀应该足够长,以使得前缀索引的选择性接近于索引整个列。换句话说,前缀的“基数”应该接近于完整列的“基数。

3.2 使用值的列表来确定前缀长度

为了决定前缀的合适长度,需要找到最常见的值的列表,然后和最常见的前缀列表进行比较,在示例数据库 Sakila中并没有合适的例子,所以我们从表city中生成一个示例表,这样就有足够的数据进行演示：

create table sakila.city_demo(city Varchar(50) NOT NULL);
INSERT INTO sakila.city_demo(city) SELECT city FROM sakila.city;
INSERT INTO sakila.city_demo(city) SELECT city FROM sakila.city_demo;
INSERT INTO sakila.city_demo(city) SELECT city FROM sakila.city_demo;
INSERT INTO sakila.city_demo(city) SELECT city FROM sakila.city_demo;
INSERT INTO sakila.city_demo(city) SELECT city FROM sakila.city_demo;
INSERT INTO sakila.city_demo(city) SELECT city FROM sakila.city_demo;
--- Now randomize the distribution (inefficiently but conveniently): 现在随机分配,低效但方便
UPDATE sakila.city_demo SET city = (SELECT city FROM sakila.city ORDER BY RAND() LIMIT 1);

现在我们有了示例数据集,数据分布当然不是真实的分布;因为我们使用了RAND(),所以你的结果会与此不同,但对这个练习来说这并不重要。首先,我们找到最常见的城市列表：

select count(*) as cnt,city 
 from sakila.city_demo Group by city Order by cnt Desc Limit 10;

注意到,上面每个值都出现了45~61次。现在查找到最频繁出现的域市前缀,先从3个前缀字母开始：

select count(*) as cnt,Left(city,3) as pref 
    from sakila.city_demo GROUP BY pref ORDER BY cnt DESC LIMIT 10;

每个前缀都比原来的城市出现的次数更多,因此唯一前缀比唯一城市要少得多,然后我们增加前缀长度,直到这个前缀的选择性接近完整列的选择性,经过实验后发现前缀长度为7时比较合适：

SELECT COUNT(*) As cnt, LEFT(city, 7) AS pref 
       FROM sakila.city_demo GROUP BY pref ORDER BY cnt DESC LIMIT 10;

3.3 使用完整列的选择性来确定前缀长度

计算合适的前缀长度的另外一个办法就是计算完整列的选择性,并使前缀的选择性接近于完整列的选择性,下面显示如何计算完整列的选择性:

SELECT COUNT(DISTINCT city)/COUNT(*) FROM sakila.city_demo;

通常来说(尽管也有例外情况),这个例子中如果前缀的选择性能够接近0.031,基本上就可用了,可以在一个查询中针对不同前缀长度进行计算,这对于大表非常有用。下面给出了如何在网一个查询中计算不同前缀长度的选择性：

SELECT COUNT(DISTINCT LEFT(city,3))/COUNT(*) AS sel3,
       COUNT(DISTINCT LEFT(city,4))/COUNT(*) AS sel4,
       COUNT(DISTINCT LEFT(city,5))/COUNT(*) AS sel5,
       COUNT(DISTINCT LEFT(city,6))/COUNT(*) AS sel6,
       COUNT(DISTINCT LEFT(city,7))/COUNT(*) AS sel7
   FROM sakila.city_demo;

查询显示当前缀长度到达7的时候,再增加前缀长度,选择性提升的幅度已经很小了。

只看平均选择性是不够的,也有例外的情况,需要考虑最坏情况下的选择性。平均选择性会让你认为前缀长度为4或者5的索引已经足够了,但如果数据分布很不均匀,可能就会有陷阱。如果观察前缀为4的最常出现城市的次数,可以看到明显不均匀：

select count(*) as cnt, Left (city,4) as pref 
    from sakila.city_demo Group by pref ORDER BY cnt DESC LIMIT 5;

如果前缀是4个字节,则最常出现的前缀的出现次数比最常出现的城市的出现次数要大很多。即这些值的选择性比平均选择性要低,如果有比这个随机生成的示例更真实的数据,就更有可能看到这种现象。例如在真实的城市名上建一个长度为4的前缀索引，对于以"San"和"New"开头的城市的选择性就会非常糟糕,因为很多城市都以这两个词开头。

3.4 创建前缀索引

在上面的示例中,已经找到了合适的前缀长度,下面演示一下如何创建索引：

alter table sakila.city_demo ADD KEY (city(7));

前缀索引是一种能使索引更小、更快的有效办法,但另一方面也有其缺点: MySQL无法使用前缀索引做ORDER BY和 GROUP BY,也无法使用前缀索引做覆盖扫描。

四、多列索引

4.1 多列索引的含义

对于多列索引一个常见的错误就是,为每个列创建独立的索引,或者按照错误的顺序创建多列索引。这是错误的，实际上，多列索引的真正含义是：为特定的列创建索引并给这些列正确排序。

4.2 从多列索引到索引合并

先来看第一个问题,为每个列创建独的索引,从 SHOW CREATE TABLE中很容易看到这种情况

CREATE TABLE t{
c1 INT,
c2 INT,
c3 INT,
KEY(c1),
KEY(c2),
KEY(c3)
}

这种索引策略,一般是由于人们听到一些专家诸如“把where条件里面的列都建上索引”这样模糊的建议导致的。实际上这个建议是非常错误的,这样一来最好的情况下也只能是“一星”索引,其性能比起真正最优的索引可能差几个数量级,有时如果无法设计一个“三星索引,那么不如忽略掉 WHERE子句,集中精力优化索引列的顺序,或者创建一个全覆盖索引。

在多个列上建立独立的单列索引大部分情况下并不能提高 MySQL的查询性能, MySQL中引入了一种叫"索引合并"( index merge)的策略,一定程度上可以使用表上的多个单列索引来定位指定的行,早期的MySQL只能使用某一个单列索引，然而这种情况下没有哪一个独立的单列索引是非常有效的。例如,表 film_id和 actor id上各有一个单列索引。但对于下面这个查询where条件,这两个单列索引都不是好的选择：

select film_id,actor_id from sakila.film_actor  
       where actor_id = 1 or film_id = 1;

在老的 MySQL版本中, MySQL对这个查询会使用全表扫描。除非改写成如下的两个查询UNION的方式：

SELECT film_id, actor_id FROM sakila.film_actor WHERE actor_id=1
UNION ALL
SELECT film_id, actor_id FROM sakila.film_actor WHERE film_id=1
AND actor_id <> 1;

但在 MySQL5.0和更新的版本中,查询能够同时使用这两个单列索引进行扫描,并将结果进行合并,这种算法有三个变种:OR条件的联合( union),AD条件的相交( intersection), 组合前两种情况的联合及相交。下面的查询就是使用了两个索引扫描的联合,通过 EXPLAIN中的 Extra列可以看到这点：

explain select film_id , actor_id  from sakila.film_actor 
        where actor_id = 1 OR film_id = 1;

MySQL会使用这类技术优化复杂查询,所以在某些语句的Extra列中还可以看到嵌套操作。

4.3 索引合并说明现有的索引很糟糕

索引合并策略有时候是一种优化的结果,但实际上更多时候说明了表上的索引建得很糟糕：

（1）当出现服务器对多个索引做相交操作时(通常有多个AND条件),通常意味着需要一个包含所有相关列的多列索引,而不是多个独立的单列索引。

（2）当服务器需要对多个索引做联合操作时(通常有多个OR条件),通常需要耗费大量CPU和内存资源在算法的缓存,、排序和合并操作上，特别是当其中有些索引的选择性不高,需要合并扫描返回的大量数据的时候。

（3）更重要的是,优化器不会把这些计算到“查询成本”中,优化器只关心随机页面读取。这会使得查询的成本被“低估”,导致该执行计划还不如直接走全表扫描。这样做不但会消耗更多的CPU和内存资源,还可能会影响查询的并发性,但如果是单独运行这样的查询则往往会忽略对并发性的影响,通常来说,还不如将查询改写成UNION的方式往往更好。

如果在 EXPLAIN中看到有索引合并,应该好好检查一下查询和表的结构,看是不是已经是最优的。也可以通过参数 optimizer_switch来关闭索引合并功能。也可以使用 IGNORE INDE提示让优化器忽略掉某些索引。

五、选择合适的索引列顺序

5.1 索引列顺序的引入

我们遇到的最容易引起困惑的问题就是索引列的顺序。正确的顺序依赖于使用该索引的查询,并且同时需要考虑如何更好地满足排序和分组的需要(顺便说明,本节内容适用于B-Tree索引;哈希或者其他类型的索引并不会像 B-Tree索引一样按顺序存储数据)。

在一个多列B-Tree索引中,索引列的顺序意味着索引首先按照最左列进行排序,其次是第二列,等等。所以,索引可以按照升序或者降序进行扫描。以满足精确符合列顺序的ORDER BY, GROUP BY和 DISTINCT等子句的查询需求。

所以多列索引的列顺序至关重要。在“三星索引”系统中,列的顺序决定了一个索引是否能够成为一个真正的“三星索引”。

5.2 索引列顺序的经验法则：将选择性最高的列放到索引最前列

对于如何选择索引的列顺序有一个经验法则:将选择性最高的列放到索引最前列,这个建议有用吗?在某些场景可能有帮助,但通常不如避免随机IO和排序那么重要,考虑问题需要更全面(场景不同则选择不同,没有一个放之四海皆准的法则。这里只是说明，这个经验法则可能没有你想象的重要)。

当不需要考虑排序和分组时,将选择性最高的列放在前面通常是很好的（即采用经验法则）,这时候索引的作用只是用于优化 WHERE条件的查找。在这种情况下,这样设计的索引确实能够最快地过滤出需要的行,对于在 WHERE子句中只使用了索引部分前缀列的查询来说选择性也更高。

然而,性能不只是依赖于所有索引列的选择性(整体基数),也和查询条件的具体值有关,也就是和值的分布有关。这和前面介绍的选择前缀的长度需要考虑的地方一样，可能需要根据那些运行频率最高的查询来调整索引列的顺序,让这种情况下索引的选择性最高。

5.3 关于选择性和基数的经验法则的不足

以下面这个查询为例：

select * from payment where staff_id = 2 and customer_id = 584;

是应该创建一个( staff_id , customer_id)索引还是应该颠倒一下顺序?可以跑一些查询来确定在这个表中值的分布情况,并确定哪个列的选择性更高,先用下面的查询预测一下,看看各个where条件的分支对应的数据基数有多大：

SELECT sum(staff_id =2),sum(customer_id=584) FROM payment;

根据前面的经验法则（即将选择性最高的列放到索引最前列）,应该将索引列 customer_id放到前面,因为对应条件值的 customer_id数量更小,我们再来看看对于这个 customer_id的条件值,对应的staff_id列的选择性如何：

SELECT sum(staff_id = 2) from payment where customer_id = 584

这样做有一个地方需要注意,查询的结果非常依赖于选定的具体值。如果按上述办法优化,可能对其他一些条件值的查询不公平,服务器的整体性能可能变得更糟,或者其他某些查询的运行变得不如预期。

如果是从诸如 pl-gwery- digest这样的工具的报告中提取“最差”查询,那么再按上述办法选定的索引顺序往往是非常高效的。如果没有类似的具体查询来运行,那么最好还是按经验法则（将选择性最高的列放到索引最前列）来做,因为经验法则考虑的是全局基数和选择性,而不是某个具体查询：

select count(distinct staff_id)/count(*) as staff_id_selectivity,
       count(distinct customer_id)/count(*) as staff_id_selectivity,
       count(*)
       from payment;

customer_id的选择性更高,所以答案是将其作为索引列的第一列：

ALTER TABLE payment ADD KEY(customer_id, staff_id);

当使用前缀索引的时候,在某些条件值的基数比正常值高的时候,问题就来了。例如，在某些应用程序中,对于没有登录的用户,都将共用户名记录为“guset”,在记录用户行为的会话( session)表和其他记录用户活动的表中“guest”就成为了一个特殊用户ID,一旦查询涉及这个用户,那么和对于正常用户的查询就大不同了,因为通常有很多会话都是没有登录的。系统账号也会导致类似的问题。一个应用通常都有一个特殊的管理员账号,和普通账号不同,它并不是一个具体的用户,系统中所有的其他用户都是这个用户的好友,所以系统往往通过它向网站的所有用户发送状态通知和其他消息。这个账号的巨大的好友列表很容易导致网站出现服务器性能问题。

这实际上是一个非常典型的向题。任何的异常用户,不仅仅是那些用于管理应用的设计槽糕的账号会有同样的问题,那些拥有大量好友、图片、状态、收藏的用户,也会有前面提到的系统账号同样的问题。

5.4 小结

小结：尽管关于选择性和基数的经验法则值得去研究和分析,但一定要记住别忘了WHERE子句中的排序、分组和范围条件等其他因素,这些因素可能对查询的性能造成非常大的影响。

六、聚簇索引

6.1 含义

聚簇索引并不是一种单独的索引类型,而是一种数据存储方式。具体的细节依赖于其实现方式,但InnoDB的聚簇索引实际上在同一个结构中保存了B-Tree索引和数据行。

当表有聚簇索引时,它的数据行实际上存放在索引的叶子页( leaf page)中,术语“聚簇”表示数据行和相邻的键值紧凑地存储在一起。因为无法同时把数据行存放在两个不同的地方,所以一个表只能有一个聚簇索引(不过,覆盖索引可以模拟多个聚簇索引的情况)。

因为是存储引擎负责实现索引,因此不是所有的存储引擎都支持聚族索引（即其他的存储引擎不一定支持聚簇索引）,本节我们主要关注 InnoDB存储引擎,但是这里讨论的原理对于任何支持聚簇索引的存储引擎都是适用的。

6.2 聚簇索引中数据分布

下图展示了聚簇索引中的数据是如何分布的。注意到,叶子页包含了行的全部数据，但是节点页只包含了索引列,在这个案例中,索引列包含的是整数值。

一些数据库服务器允许选择哪个索引作为聚簇索引,InnoDB存储引擎通过主键聚集数据,这也就是说上图中的“被索引的列”就是主键列。

如果没有定义主键, InnoDB会选择一个唯一的非空索引代替。如果没有这样的索引,InnoDB会隐式定义一个主键来作为聚族索引, InnoDB只聚集在同一个页面中的记录,包含相邻键值的页面可能会相距甚远。

6.3 聚簇索引的优点

聚簇索引有以下优点：

（1）可以把相关数据保存在一起。例如实现电子邮箱时,可以根据用户ID来聚集数据,这样只需要从磁盘读取少数的数据页就能获取某个用户的全部邮件。如果没有使用聚簇索引,则每封邮件都可能导致一次磁盘I/O。
（2）数据访问更快。聚簇索引将索引和数据保存在同一个B-Tree中,因此从聚簇索引中获取数据通常比在非聚簇索引中查找要快。
（3）使用覆盖索引扫描的查询可以直接使用页节点中的主键值。

如果在设计表和查询时能充分利用上面的优点,那就能极大地提升性能。同时,聚簇索引也有一些缺点。

6.4 聚簇索引的缺点

（1）聚簇数据最大限度地提高了I/O密集型应用的性能,但如果数据全部都放在内存中,则访问的顺序就没那么重要了,聚簇索引也就没什么优势了。
（2）插入速度严重依赖于插入顺序,按照主键的顺序插入是加载数据到 InnoDB表中速度最快的方式。但如果不是按照主键顺序加载数据,那么在加载完成后最好使用OPITMIZE TABLE命令重新组织一下表。
（3）更新聚簇索引列的代价很高,因为会强制InnoDB将每个被更新的行移动到新的位置。
（4）基于聚簇索引的表在插入新行,或者主键被更新导致需要移动行的时候,可能面临“页分裂( page split)”的问题。当行的主键值要求必须将这一行插入到某个已满的页中时,存储引擎会将该页分裂成两个页面来容纳该行,这就是一次页分裂操作。页分裂会导致表占用更多的磁盘空间。
（5）聚簇索引可能导致全表扫描变慢,尤其是行比较稀疏,或者由于页分裂导致数据存储不连续的时候。
（6）二级索引(非聚簇索引)可能比想象的要更大,因为在二级素引的叶子节点包含了引用行的主键列。
（7）二级索引访问需要两次索引查找,而不是一次。

最后一点可能让人有些疑惑,为什么二级索引需要两次索引查找?答案在于二级索引中保存的“行指针”的实质,要记住,二级索引叶子节点保存的不是指向行的物理位置的指针,而是行的主键值。

这意味着通过二级索引查找行,存储引擎需要找到二级索引的叶子节点获得对应的主键值,然后根据这个值去聚簇索引中查找到对应的行。这里做了重复的工作：两次 B-Tree 查找而不是一次。对于 InnoDB,自适应哈希索引能够减少这样的重复工作。

6.5 聚簇索引的应用：InnoDB和 MyISAM的数据分布对比

聚簇索引和非聚簇索引的数据分布有区别,以及对应的主键索引和二级索引的数据分布也有区别,通常会让人感到困扰和意外,来看看 InnoDB和 MyIsAM是如何存储下面这表的：

create table layout_test(
   col1 int NOT NULL,
   col2 int NOT NULL,
   PRIMARY KEY(col1),
   KEY(col2)
);

DROP PROCEDURE IF EXISTS proc_initData1;
CREATE PROCEDURE proc_initData1()
BEGIN
    DECLARE i INT DEFAULT 1;
    WHILE i<=10000 DO
       INSERT INTO layout_test(col1,col2) VALUES(i,rand()*100);
        SET i = i+1;
    END WHILE;
END

CALL proc_initData1();

运行结果：

假设该表的主键取值为1-10000,按照随机顺序插入并使用OPTIMIZE TABLE命令做了优化。换句话说,数据在磁盘上的存储方式已经最优,但行的顺序是随机的。列col2的值是从1~100之间随机赋值,所以有很多重复的值。

6.5.1 MyISAM的数据分布(不支持聚簇索引)

MyISAM的数据分布非常简单,所以先介绍它。 MyISAM按照数据插入的顺序存储在磁盘上,如图所示：

在行的旁边显示了行号,从0开始递增,因为行是定长的,所以 MyISAM可以从表的开头跳过所需的字节找到需要的行( MyIsAM并不总是使用上图中的“行号,而是根据定长还是变长的行使用不同策略)。

这种分布方式很容易创建索引,下面显示的一系列图,隐藏了页的物理细节,只显示索引中的“节点”,索引中的每个叶子节点包含“行号”。

这里忽略了一些细节,例如前一个B-Tree节点有多少个内部节点,不过这并不影响对非聚簇存储引擎的基本数据分布的理解。

那col2列上的索引又会如何呢?有什么特殊的吗?实际上，它和其他索引没有什么区别,下图显示了col2列上的索引。

小结：MyISAM中主键索引和其他索引在结构上没有什么不同。主键索引就是一个为PRIMARY的唯一非空索引。

6.5.2 InnoDB的数据分布(支持聚簇索引)

因为支持聚簇索引,所以使用非常不同的方式存储同样的数据。 InnoDB以下图所示的方式存储数据：

第一眼看上去,感觉InnoDB数据分布和MyISAM数据分布没有什么不同,但再仔细看细节,会注意到该图显示了整个表,而不是只有索引。因为在 InnoDB中,聚簇索引“就是”表，像MyISAM那样需要独立的行存储。

聚簇索引的每一个叶子节点都包含了主键值、事务ID、用于事务和 MVCC的回滚指针以及所有的剩余列(在这个例子中是col2)。如果主键是一个列前缀索引, InnoDB也会包含完整的主键列和剩下的其他列。

还有一点和 MyISAM的不同是, InnoDB的二级索引和聚簇索引很不相同, InnoDB二级索引的叶子节点中存储的不是“行指针”,而是主键值,并以此作为指向行的“指针”。这样的策略减少了当出现行移动或者数据页分裂时二级索引的维护工作。使用主键值当作指针会让二级索引占用更多的空间,换来的好处是, InnoDB在移动行时无须更新二级索引中的这个“指针”。

下图显示了示例表的col2索引。一个叶子节点都包含了索引列(这里是col2),紧接着是主键值(co1)。该图展示了 B-Tree的叶子节点结构,但我们故意省略了非叶子节点这样的细节。

InnoDB的非叶子节点包含了索引列和一个指向下级节点的指针(下一级节点可以是非叶子节点，也可以是叶子节点)，这对聚簇索引和二级索引都适用。

6.5.3 InnoDB和MyISAM的表存放方式

下图是描述 InnoDB和MyISAM如何存放表的抽象图。从图中可以很容易看出 InnoDB和 MyISAM保存数据和索引的区别。

6.6 聚簇索引的应用之聚集特性：主键单调递增 VS 主键UUID

如果正在使用 InnoDB表并且没有什么数据需要聚集,那么可以定义一个代理键 ( surrogate key)作为主键,这种主键的数据应该和应用无关,最简单的方法是使用 AUTO_INCREMENT自增列。这样可以保证数据行是按顺序写入,对于根据主键做关联操作的性能也会更好。

最好避免随机的(不连续且值的分布范围非常大)聚簇索引,特别是对于I/O密集型的应用,因为从性能的角度考虑,使用UUID来作为聚簇索引则会很槽糕,它使得聚簇索引的插入变得完全随机,这是最坏的情况,使得数据没有任何聚集特性。

为了演示这一点,我们做如下两个基准测试。

6.6.1 在 InnoDB表中按主键顺序插入行

第一个使用整数ID插入 userinfo表：

create table userinfo (
id         int unsigned not null auto_increment,
name       varchar(255) not null default '',
email      varchar(255) not null default '',
password   varchar(255) not null default '',
dob        date default null,
address    varchar(255) not null default '',
city       varchar(255) not null default '',
state_id   tinyint unsigned not null default '0',
zip   varchar(255) not null default '',
country_id   smallint unsigned not null default '0',
gender   varchar(255) not null default 'M',
account_type      varchar(255) not null default '',
verified     tinyint not null default '0',
allow_mail   tinyint unsigned not null default '0',
parrent_account   int unsigned not null default '0',
closest_airport  varchar(255) not null default '',
primary key (id),
unique key mail(email),
key  country_id (country_id),
key  state_id(state_id),
key  state_id_2(state_id,city,address)
)engine=InnoDB;

运行成功：

注意到userinfo使用了自增的整数作为主键。

6.6.2 在 InnoDB表中按UUID插入行

第二个例子是 userinfo_uuid表,除了主键改为UUID,其余和前面的 userinfo表完全相同，如下：

create table userinfo_uuid (
uuid       varchar(255) not null,
name       varchar(255) not null default '',
email      varchar(255) not null default '',
password   varchar(255) not null default '',
dob        date default null,
address    varchar(255) not null default '',
city       varchar(255) not null default '',
state_id   tinyint unsigned not null default '0',
zip   varchar(255) not null default '',
country_id   smallint unsigned not null default '0',
gender   varchar(255) not null default 'M',
account_type      varchar(255) not null default '',
verified     tinyint not null default '0',
allow_mail   tinyint unsigned not null default '0',
parrent_account   int unsigned not null default '0',
closest_airport  varchar(255) not null default '',
primary key (uuid),
unique key mail(email),
key  country_id (country_id),
key  state_id(state_id),
key  state_id_2(state_id,city,address)
)engine=InnoDB;

运行结果：

6.6.3 测试：按主键顺序插入行 VS 按UUID插入行

首先,我们在一个有足够内存容纳索引的服务器上向这两个表各插入100万条记录。

DROP PROCEDURE IF EXISTS proc_userinfo;
CREATE PROCEDURE proc_userinfo()
BEGIN
    DECLARE i INT DEFAULT 1;
    WHILE i<=1000000 DO
       INSERT INTO userinfo(id,name,email) VALUES(i,rand()*1000000,i);
        SET i = i+1;
    END WHILE;
END

CALL proc_userinfo();

然后向这两个表继续插入300万条记录,使索引的大小超过服务器的内存容量。

得到的结果是，向UUID主键插入行不仅花费的时间更长,而且索引占用的空间也更大,原因一方面是由于主键字段更长，另一方面毫无疑问是由于页分裂和碎片导致的。

6.6.4 问题：为什么使用UUID作为主键插入花费的时间长且索引占用空间大？

当使用递增主键时，主键的值是顺序的,所以 InnoDB把每一条记录都存储在上一条记录的后面。当达到页的最大填充因子时(InnoDB默认的最大填充因子是页大小的 15/16,留出部分空间用于以后修改),下一条记录就会写入新的页中。一旦数据按这种顺序的方式加载,主键页就会近似于被顺序的记录填满,这也正是所期望的结果(然而，二级索引页可能是不一样的)。

当使用UUID主键时，新行的主键值不一定比之前插入的大,所以 InnoDB无法简单地总是把新行插入到索引的最后,而是需要为新的行寻找合适的位置——通常是已有数据的中间位置——并且分配空间。这会增加很多的额外工作,并导致数据分布不够优化。

6.6.5 使用UUID作为主键的缺点

（1）写入的目标页可能已经刷到磁盘上并从缓存中移除,或者是还没有被加载到缓存中，InnoDB在插入之前不得不先找到并从磁盘读取目标页到内存中，这将导致大量的随机I/O。

（2）因为写入是乱序的, InnoDB不得不频繁地做页分裂操作,以便为新的行分配空间。页分裂会导致移动大量数据,一次插入最少需要修改三个页而不是一个页。

（3）由于频繁的页分裂,页会变得稀疏并被不规则地填充,所以最终数据会有碎片。

在把这些随机值载入到聚簇索引以后,可能需要做一次OPTIMIZE TABLE来重建表并优化页的填充。

6.6.6 小结

小结：使用 InnoDB时应该尽可能地按主键顺序插入数据,并且尽可能地使用单调增加的聚簇键的值来插入新行，这样才能保证较好的聚集效应。

七、覆盖索引

7.1 含义

含义：如果一个索引包含(或者说覆盖)所有需要查询的字段的值，即索引的叶子节点中已经包含要查询的数据， MySQL可以使用索引来直接获取列的数据,而不再需要读取数据行，这样的索引称之为“覆盖索引”。

7.2 覆盖索引的四个优点（即整个查询仅需要扫描索引而无须回表的优点）

（1）索引条目通常远小于数据行大小,所以如果只需要读取索引,那 MySQL就会极大地减少数据访问量。这对缓存的负载非常重要,因为这种情况下响应时间大部分花费在数据拷贝上,覆盖索引对于I/O密集型的应用也有帮助,因为索引比数据更小,更容易全部放入内存中。

（2）因为索引是按照列值顺序存储的(至少在单个页内是如此),所以对于I/O密集型的范围查询会比随机从磁盘读取每一行数据的I/O要少得多。

（3）一些存储引擎如 MyIsAM在内存中只缓存索引,数据则依赖于操作系统来缓存,因此要访问数据需要一次系统词用,这可能会导致严重的性能问题,尤其是那些系统调用占了数据
访问中的最大开销的场景。

（4）由于InnoDB的聚簇索引,覆盖索引对 InnoDB表特别有用。InnoDB的二级索引在叶子节点中保存了行的主键值,所以如果二级主键能够覆盖查询,则可以避免对主键索引的二次查询。

小结：在所有这些场景中,在索引中满足查询的成本一般比查询行要小得多，这全是覆盖索引展现其优势的机会。

7.3 覆盖索引的局限

（1）不是所有类型的索引都可以成为覆盖索引。覆盖索引必须要存储索引列的值，但是哈希索引、空间索引和全文索引等都不存储索引列的值,所以 MySQL只能使用B-Tree覆盖索引。

（2）不同的存储引擎实现覆盖索引的方式也不同,而且不是所有支持覆盖索引。

7.4 覆盖索引的应用

当发起一个被索引覆盖的查询(也叫做索引覆盖查询)时,在 EXPLATN的 Extra列可以看到" Using index"的信息,例如,表 sakila.inventory有一个多列索引( store_id ,film_id)。MySQL如果只需访向这两列,就可以使用这个索引做覆盖索引,如下所示：

explain select store_id,film_id from sakila.inventory

八、使用索引扫描来做排序

8.1 索引排序

MySQL有两种方式可以生成有序的结果：

（1）通过排序操作；
（2）按索引顺序扫描（本节重点）。

如果 EXPLAIN出来的type列的值为" index’,则说明 MySQL使用了索引扫描来做排序(不要和 Extra列的" Using index”搞混淆了)。

扫描索引本身是很快的,因为只需要从一条索引记录移动到紧接着的下一条记录,但如果索引不能覆盖查询所需的全部列,那就不得不每扫描一条索引记录就都回表查询一次对应的行。这基本上都是随机I/O,因此按索引顺序读取数据的速度通常要比顺序地全表扫描慢,尤其是在I/O密集型的工作负载时。

8.2 索引既满足排序,又用于查找行

MySQL可以使用同一个索引既满足排序,又用于查找行。因此,如果可能,设计索引时应该尽可能地同时满足这两种任务,这样是最好的。

只有当索引的列顺序和ORDER BY子句的顺序完全一致,并且所有列的排序方向(倒序或正序)都一样时, MySQL才能够使用索引来对结果做排序。如果查询需要关联多张表，则只有当ORDER BY子句引用的字段全部为第一个表时，才能使用索引做排序。ORDER BY子句和查找型查询的限制是一样的：需要满足索引的最左前缀的要求,否则,MySQL都需要执行排序操作，而无法利用索引排序。

8.3 前导项为常量

有一种情况下 ORDER BY子句可以不满足索引的最左前缀的要求,就是前导列为常量的时候,如果where子句或者Join子句中对这些列指定了常量,就可以“弥补”索引的不足。

例如, Sakila示例数据库的表 rental在列( rental_date, inventory_id, customer_id) 上有名为 rental_date的索引。

MySQL可以使用 rental_date索引为下面的查询做排序,从 EXPLAIN中可以看到没有出现文件排序( filesort)操作：

explain select rental_id , staff_id from sakila.rental
    where rental_date = '2005-05-25'
    order by inventory_id,customer_id

即使ORDER BY子句不满足索引的最左前缀的要求,也可以用于查询排序,这是因为索引的第一列被指定为一个常数。

8.4 使用索引排序

还有更多可以使用索引做排序的查询示例。下面这个查询可以利用索引排序,是因为查询为索引的第一列提供了常量条件,而使用第二列进行排序,将两列组合在一起,就形成了索引的最左前缀：

... where rental_date='2005-05-25' ORDER BY inventory_id DESC;

下面这个查询也没问题,因为 ORDER BY使用的两列就是索引的最左前缀：

where rental date>'2005-o5-25' ORDER BY rental date, inventory_id;

8.5 未使用索引排序

下面是一些不能使用索引做排序的查询：

下面这个查询使用了两种不同的排序方向,但是索引列都是正序排序的：

where rental_date='2005-05-25' ORDER BY inventory_id DESC, customer_id ASC;

下面这个查询的ORDER BY子句中引用了一个不在索引中的列:

where rental_date='2005-05-25" ORDER BY inventory_id, staff_id;

下面这个查询的WHERE和ORDER BY中的列无法组合成索引的最左前缀：

where rental_date='2005-05-25' ORDER BY customer_id；

下面这个查询在索引列的第一列上是范围条件,所以 MySQL无法使用索引的其余列：

where rental_date >'2005-05-25' ORDER BY inventory_id, customer_id;

这个查询在 inventory_id列上有多个等于条件。对于排序来说,这也是一种范围查询：

WHERE rental_date = '2005-05-25' AND inventory_id IN(1, 2) ORDER BY customer_id;

下面这个例子理论上是可以使用索引进行关联排序的,但由于优化器在优化时将film_actor表当作关联的第二张表,所以实际上无法使用索引：

explain select actor_id , title from sakila.film_actor
       inner join sakila.film using(film_id) order by actor_id;

8.6 索引排序的应用

使用索引做排序的一个最重要的用法是当SQL查询同时有ORDER BY和LIMIT子句的时候。

九、压缩(前缀压缩)索引

MyISAM使用前缀压缩来减少索引的大小,从而让更多的索引可以放入内存中,这在某些情况下能极大地提高性能。默认只压缩字符串,但通过参数设置也可以对整数做压缩。

MyISAM压缩每个索引块的方法是,先完全保存索引块中的第一个值,然后将其他值和第一个值进行比较得到相同前缀的字节数和副余的不同后缀部分,把这部分存储起来即可。例如,索引块中的第一个值是“perform”,第二个值是“performance",那么第二个值的前缀压缩后存储的是类似“7,ance”这样的形式, MyISAM对行指针也采用类似的前缀压缩方式。

压缩块使用更少的空间,代价是某些操作可能更慢。因为每个值的压缩前缀都依赖前面的值,所以 MyISAM查找时无法在索引块使用二分查找而只能从头开始扫描。正序的扫描速度还不错,但是如果是倒序扫描(例如ORDER BY DESC)就不是很好了,所有在块中查找某一行的操作平均都需要扫描半个索引块。

测试表明,对于CPU密集型应用,因为扫描需要随机查找,压缩索引使得 MyISAM在索引查找上要慢好几倍。压缩索引的倒序扫描就更慢了。压缩索引需要在CPU内存资源与磁盘之间做权衡。压缩索引可能只需要十分之一大小的磁盘空间,如果是I/O密集型应用,对某些查询带来的好处会比成本多很多。

程序员可以在 CREATE TABLE语句中指定 PACK KEYS参数来控制索引压缩的方式。

十、冗余和重复索引

10.1 重复索引

含义：重复索引是指在相同的列上按照相同的顺序创建的相同类型的索引。注意，重复索引的三个相同：所在列相同、排列顺序相同、索引类型相同。

MySQL允许在相同列上创建多个索引,这些创建出来的索引MySQL都需要维护,并且优化器在优化查询的时候也需要逐个地进行考虑。大量冗余和重复的索引会影响性能，应该避免这样创建重复索引,发现以后也应该立即移除。

有时会在不经意间创建了重复索引,例如下面的代码

create table test(
ID INT NOT NULL PRIMARY KEY,
A  INT NOT NULL,
B  INT NOT NULL,
UNIQUE(ID),
INDEX(ID)
)ENGINE=InnoDB;

一个经验不足的用户可能是想创建一个主键,先加上唯一限制UNIQUE ,然后再加上索引INDEX 以供查询使用,事实上, MySQL的唯一限制UNIQUE 和主键限制PRIMARY KEY 都是通过索引实现的,因此,上面的写法实际上在相同的列上创建了三个重复的索引,我们没有理由这样做,除非是在同一列上创建不同类型的索引来满足不同的查询需求。

10.2 冗余索引

含义：如果创建了索引(A,B),再创建索引(A)就是冗余索引,因为这只是前一个索引的前缀索引。因此索引(A,B)也可以当作索引(A)来使用(这种冗余只是对B-Tree索引来说的)。

但是如果再创建索引(B,A),则不是冗余索引,索引(B) 也不是,因为B不是索引(A,B)的最左前缀列,另外,其他不同类型的索引(例如哈希索引或者全文索引)也不会是B-Tree索引的冗余索引,无论覆盖的索引列是什么，因为索引类型不同了。

10.3 扩展已有的索引 VS 创建新索引

冗余索引通常发生在为表添加新索引的时候。例如,有人可能会增加一个新的索引(A,B)而不是扩展已有的索引(A)。还有一种情况是将一个索引扩展为(A,ID),其中ID是主键,对于 InnoDB来说主键列已经包含在二级索引中了,所以这也是冗余的。

大多数情况下都不需要冗余索引,应该尽量扩展已有的索引而不是创建新索引。

但也有时候出于性能方面的考虑需要冗余索引,因为扩展已有的索引会导致其变得太大，从而影响其他使用该索引的查询的性能。

例如,如果在整数列上有一个索引,现在需要额外增加一个很长的 VARCHAR列来扩展该索引,那性能可能会急剧下降,特别是有查询把这个索引当作覆盖索引,或者这是 MyISAM表并且有很多范围查询(由于 MyISAM的前缀压缩)的时候。

考虑一下前面“在 InnoDB中按主键顺序插入行”一节提到的 userinfo表。这个表有1 000 000行,对每个 state_id值大概有20000条记录,在 state_id列有一个索引对下面的查询有用,假设查询名为Q1：

mysql> SELECT count(*) FROM userinfo WHERE state_id=5;

一个简单的测试表明该查询的执行速度大概是每秒115次(QPS)。还有一个相关查询需要检索几个列的值,而不是只统计行数,假设名为Q2:

mysql> SELECT state_id,city,address FROM userinfo WHERE state_id=5;

对于这个查询测试结果QPS小于10。提升该查询性能的最简单办法就是扩展索引为 state_id,city, address),让索引能覆盖查询

mysql >ALTER TABLE userinfo drop key state_id, add key 
state_id_2(state_id, cty, address);

索引扩展后,Q2运行得更快了,但是Q1却变慢了,如果我们想让两个查询都变得更快,就需要两个索引,尽管这样一来原来的单列索引是冗余的了。

有两个索引的缺点是索引成本更高，因为表中的索引越多插入速度会越慢。一般来说,增加新索引将会导致 INSERT、UPDATE、DETE等操作的速度变慢,特别是当新增索引后导致达到了内存瓶颈的时候。

10.4 冗余索引和重复索引解决方法

解决冗余索引和重复索引的方法很简单,删除这些索引就可以,但首先要做的是找出这样的索引,可以通过写一些复杂的访问 INFORMATION SCHEMA表的查询来找,

在决定哪些索引可以被删除的时候要非常小心,在前面的 InnoDB的示例表中,因为二级索引的叶子节点包含了主键值,所以在列(A)上的索引就相当于在(A,ID) 上的索引。如果有像where A=50 ORDER BY ID这样的查询,这个索引会很有作用。但如果将索引扩展为(A,B),则实际上就变成了(A,B,ID),那么上面查询的 ORDER BY子句就无法使用该索引做排序,而只能用文件排序了。

十一、未使用的索引

含义：服务器永远不会使用的数据库的索引,这样索引称为未使用的索引。

未使用的索引是服务器不会用到的索引，是没有任何实际作用，这样的索引完全是累赘。我们的做法是将其删除。

有两个工具可以帮助定位未使用的索引。最简单有效的办法是在 Percona Server或者 MariaDB中先打开 overstates服务器变量(默认是关闭的),然后让服务器正常运行一段时间,再通过查询 INFORMATION_SCHEMA, INDEX_STATISTICS就能查到每个索引的使用频率。

另外，还可以使用 Percona Toolkit 中的 pt-index-usage,该工具可以读取查询日志,并对日志中的每条查询进行 EXPLAIN操作,然后打印出关于索引和查询的报告。这个工具不仅可以找出哪些索引是未使用的,还可以了解查询的执行计划(例如在某些情况,有些类似的查询的执行方式不一样,这可以帮助你定位到那些偶尔服务质量差的查询,优化它们以得到一致的性能表现,该工具也可以将结果写入到 MySQL的表中,方便查询结果)。

十二、索引和锁

索引可以让查询索引更少的行。如果你的查询从不访问那些不需要的行,那么就会锁定更少的行,从两个方面来看这对性能都有好处。

（1）首先,虽然 InnoDB的行锁效率很高,内存使用也很少,因为锁定行的时候仍然会带来额外开销;
（2）其次,锁定超过需要的行会增加锁争用并减少并发性。

InnoDB只有在访问行的时候才会对其加锁。而索引能够减少 InnoDB访问的行数,从而减少锁的数量。但这只有当 InnoDB在存储引擎层能够过滤掉所有不需要的行时才有效。如果索引无法过滤掉无效的行,那么需要在InnoDB检索到数据并返回给服务器层以后, MySQL服务器才能应用where子句。这时已经无法避免锁定行了：InnoDB已经锁住了这些行,到适当的时候才释放。

通过下面的例子再次使用数据库sakila很好地解释了这些情况：

mysql> SET AUTOCOMMIT=0;
mysql> BEGIN;
mysql> select actor_id FROM sakila.actor where actor_id < 5
           and actor_id <> 1 FOR UPDATE;

这条查询仅仅会返回2-4之间的行,但是实际上获取了1~4之间的行的排他锁。InnoDB会锁住第1行,这是因为 MysQL为该查询选择的执行计划是索引范围扫描：

explain select actor_id from sakila.actor
      where actor_id < 5 and actor_id <> 1 for update;

换句话说,底层存储引擎的操作是“从索引的开头开始获取满足条件 actor id<5的记录”,服务器并没有告诉 InnoDB可以过滤第1行的 WHERE条件。注意到 EXPLAIN的 Extra列出现了“ Using where ”,这表示 MySQL服务器是在将存储引擎返回行以后再应用where过滤条件。

下面的第二个查询就能证明第1行确实已经被锁定，保持第一个连接打开,然后开启第二个连接并执行

mysql> SET AUTOCOMMIT=0;
mysql> BEGIN;
mysql> select actor_id FROM sakila.actor where actor_id = 1 for update;

这个查询将会挂起,直到第一个事务释放第1行的锁。所以证明了，之前的第一个查询证明将第1行确实锁定了。

如上所述，即使使用了索引,InnoDB也可能锁住一些不需要的数据。如果不能使用索引查找和锁定行的话问题可能会更糟糕, MySQL会做全表扫描并锁住所有的行,而不管是不是需要。

十三、索引优化技巧一览

常见索引原则有：

选择唯一性索引：唯一性索引的值是唯一的，可以更快速的通过该索引来确定某条记录。
为经常需要排序、分组和联合操作的字段建立索引。
为常作为查询条件的字段建立索引。
限制索引的数目：越多的索引，会使更新表变得很浪费时间。
尽量使用数据量少的索引。
如果索引的值很长，那么查询的速度会受到影响。
尽量使用前缀来索引：如果索引字段的值很长，最好使用值的前缀来索引。
删除不再使用或者很少使用的索引
最左前缀匹配原则，非常重要的原则。
尽量选择区分度高的列作为索引：区分度的公式是表示字段不重复的比例
索引列不能参与计算，保持列“干净”：带函数的查询不参与索引。
尽量的扩展索引，不要新建索引。

十四、小结

本文中介绍MySQL索引优化原则，是MySQL查找性能优化的重要内容之一，希望对读者有用。

天天打码，天天进步！

你可能感兴趣的:(数据库/Linux)

Linux系统配置（应用程序） 1风天云月 Linux linux 应用程序编译安装 rpm http
目录前言一、应用程序概述1、命令与程序的关系2、程序的组成3、软件包封装类型二、RPM1、RPM概述2、RPM用法三、编译安装1、解包2、配置3、编译4、安装5、启用httpd服务结语前言在Linux中的应用程序被视为将软件包安装到系统中后产生的各种文档，其中包括可执行文件、配置文件、用户手册等内容，这些文档被组织为一个有机的整体，为用户提供特定的功能，因此对于“安装软件包”与“安装应用程序”这两
什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
包含日志获取webshell 陈望_ning
日志文件关闭：Apache目录下的httpd.conf文件#ErrorLog"logs/error.log"#CustomLog"logs/access.log"common加#号为注释不产生日志文件如果去掉#将会在Apache/logs/目录下产生日志文件linux:access_logerror_logwindows:access.logerror.logaccess_log每一行记录了一次网
Android 应用权限管理详解
文章目录1.权限类型2.权限请求机制3.权限组和分级4.权限管理的演进5.权限监控和SELinux强制访问控制6.应用权限审核和GooglePlayProtect7.开发者最佳实践8.用户权限管理9.Android应用沙箱模型10.ScopedStorage（分区存储）11.背景位置权限（BackgroundLocationAccess）12.权限回收和自动清理13.权限请求的用户体验设计14.G
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
Mac OSX 下的mysql数据库文件存放位置 Bruuuces mysql mac osx 位置存放
之前我的mysql的系统数据库里的表被我玩坏了，万般无奈之下只得删除所有mysql的东西重新构建数据库。按照网上搜到的内容删除后重装发现数据库没有什么变化。于是自己在每个可能存放数据库文件的目录查找，最终确认目录位置如下:使用HomeBrew安装为/usr/local/var/mysql使用官方下载的dmg镜像安装为/usr/local/mysql删除这个目录再重新安装mysql就会重新生成系统数
mac升级mysql_Mac OSX下的MySQL数据库升级 weixin_39801714 mac升级mysql
MacOSX下的数据库升级最麻烦的不过权限的问题.本文的MySQL的安装方式为OSX下DMG磁盘镜像的安装方式,MacPorts/Homebrew的方式大同小异.从5.6.17升级到5.7.18安装目录信息ls-al/usr/local|grepmysqllrwxr-xr-x1rootwheel30B52100:39mysql@->mysql-5.6.17-osx10.7-x86_64drwxr-
【MySQL】MySQL数据库如何改名武昌库里写JAVA 面试题汇总与解析 spring boot vue.js sql java 学习
MySQL建库授权语句https://www.jianshu.com/p/2237a9649ceeMySQL数据库改名的三种方法https://www.cnblogs.com/gomysql/p/3584881.htmlMySQL安全修改数据库名几种方法https://blog.csdn.net/haiross/article/details/51282417MySQL重命名数据库https://
HikariCP调试日志深度解析：生产环境故障排查完全指南
HikariCP调试日志深度解析：生产环境故障排查完全指南更新时间：2025年7月4日|作者：资深架构师|适用版本：HikariCP5.x+|难度等级：中高级前言在生产环境中，数据库连接池往往是系统性能的关键瓶颈。HikariCP作为当前最流行的Java连接池，其调试日志包含了丰富的运行时信息，能够帮助我们快速定位和解决各种连接池相关问题。本文将深入解析HikariCP的日志体系，提供一套完整的故
大学社团管理系统（11831） codercode2022 java spring boot spring echarts spring cloud sentinel java-rocketmq
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发四、项目截图有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
前端数据库：IndexedDB从基础到高级使用指南
文章目录前端数据库：IndexedDB从基础到高级使用指南引言一、IndexedDB概述1.1什么是IndexedDB1.2与其他存储方案的比较二、基础使用2.1打开/创建数据库2.2基本CRUD操作添加数据读取数据更新数据删除数据三、高级特性3.1复杂查询与游标3.2事务高级用法3.3性能优化技巧四、实战案例：构建离线优先的待办事项应用4.1数据库设计4.2同步策略实现五、常见问题与解决方案5.
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
修改gitlab默认的语言 Victor刘 gitlab
文章目录网上的方法1.采用数据库触发器的方法2.登录pg库2.1查看表2.2创建function2.3创建触发器2.4修改历史数据网上的方法网上修改/opt/gitlab/embedded/service/gitlab-rails/config/application.rb的方法，我试了，没生效，没进一步研究1.采用数据库触发器的方法2.登录pg库su-gitlab-psqlpsql-h/var/
在Windows11上安装Linux操作系统的几种技术方案 yuanpan linux 运维服务器
在Windows11上安装Linux主要有以下几种技术方案，每种方案适用于不同的需求场景：1.WindowsSubsystemforLinux(WSL)适用场景：开发、命令行工具、轻量级Linux环境支持发行版：Ubuntu、Debian、KaliLinux、Fedora等优点：轻量级：无需虚拟机，直接在Windows上运行Linux命令行环境。无缝集成：可访问Windows文件系统，支持VSCo
Claude Code 超详细完整指南（2025最新版）笙囧同学 python
终端AI编程助手|高频使用点+生态工具+完整命令参考+最新MCP配置目录快速开始（5分钟上手）详细安装指南系统要求Windows安装（WSL方案）macOS安装Linux安装安装验证配置与认证首次认证环境变量配置代理配置⚡基础命令详解启动命令会话管理文件操作Think模式完全指南MCP服务器配置详解MCP基础概念添加MCP服务器10个必备MCP服务器MCP故障排除记忆系统详解高级使用技巧成本控制策
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和运行 Redis 服务器山岚的运维笔记 Linux 运维及使用 linux 服务器 ubuntu redis 数据库
Redis（RemoteDictionaryServer，远程字典服务器）是一种内存数据结构存储，通常用作NoSQL数据库、缓存和消息代理。它是开源的，因此用户可以免费安装，无需支付任何费用。Redis旨在为需要快速数据访问和低延迟的应用程序提供速度和效率。Redis支持多种数据类型，包括字符串（Strings）、列表（Lists）、集合（Sets）、哈希（Hashes）、有序集合（SortedS
数据库基础概念梳理 22:30Plane-Moon 数据库
1.数据存储类型表(Table):存储结构化数据的标准方式，数据以行和列的形式组织，具有固定的格式。非结构化数据(UnstructuredData):如音频、视频、图片、文本文档等，其格式不固定，不易直接用表存储。2.SQL的核心优势SQL尤其擅长处理和操作存储在表中的结构化数据。2.1数据类型约束(DataTypeConstraints):定义列可存储的数据种类。整数类型:TINYINT(1字节
Linux中Samba服务器安装与配置文件長樂.- linux 运维服务器
Samba简述27zkqsamba是一个基于TCP/IP协议的开源软件套件，可以在Linux、Windows、macOS等操作系统上运行。它允许不同操作系统的计算机之间实现文件和打印机共享。samba提供了一个服务，使得Windows操作系统可以像访问本地文件一样访问Linux、Mac等操作系统上的共享文件。实现跨平台的文件共享，提高办公环境的效率和便利性。samba也支持Windows网络邻居协
SQL笔记纯干货 AI入门修炼 oracle 数据库 sql
软件：DataGrip2023.2.3，phpstudy_pro,MySQL8.0.12目录1.DDL语句（数据定义语句）1.1数据库操作语言1.2数据表操作语言2.DML语句（数据操作语言）2.1增删改2.2题2.3备份表3.DQL语句（数据查询语言）3.1查询操作3.2题一3.3题二4.多表详解4.1一对多4.2多对多5.多表查询6.窗口函数7.拓展:upsert8.sql注入攻击演示9.拆表
分布式全局唯一ID生成：雪花算法 vs Redis Increment，怎么选？
雪花算法vsRedisIncrement：分布式全局唯一ID生成方案深度对比在分布式系统开发中，“全局唯一ID”是绕不开的核心问题。无论是分库分表的数据库设计、订单编号的唯一性保证，还是日志追踪的链路标识，都需要一套可靠的ID生成方案。今天我们就来聊聊两种主流方案——雪花算法（Snowflake）和RedisIncrement，并从原理、特性到适用场景，帮你理清如何选择。同时，我们还将对比其他常见
ubuntu qt环境下出现No suitable kits found解决方案
1.清理QtCreator缓存QtCreator会缓存项目配置、索引等数据，可能导致某些异常。清理方法：(1)删除QtCreator配置目录bashrm-rf~/.config/QtProject/（Ubuntu/Linux）或Windows：cmdrmdir/s/q"%APPDATA%\QtProject"(2)清除QtCreator的编译缓存bashrm-rf~/.cache/QtProjec
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和使用 NoMachine 山岚的运维笔记 Linux 运维及使用 linux ubuntu 运维 nomachine 远程连接
NoMachine是一款适用于Linux（Ubuntu）及其他支持的操作系统的远程桌面应用程序，允许用户通过本地或远程系统从世界任何地方控制计算机。它可以在低带宽连接下工作，被专业人士和家庭用户广泛使用。NoMachine的主要功能高性能远程访问跨平台兼容性易于使用，因为用户界面友好提供强大的加密协议，如SSH、SSL及其他安全标准支持远程文件传输和打印服务允许从远程计算机进行音频和视频流媒体传输
【Druid】学习笔记 fixAllenSun 学习笔记 oracle
【Druid】学习笔记【一】简介【1】简介【2】数据库连接池（1）能解决的问题（2）使用数据库连接池的好处【3】监控（1）监控信息采集的StatFilter（2）监控不影响性能（3）SQL参数化合并监控（4）执行次数、返回行数、更新行数和并发监控（5）慢查监控（6）Exception监控（7）区间分布（8）内置监控DEMO【4】Druid基本配置参数介绍【5】Druid相比于其他数据库连接池的优点
构建高效的物流车辆定位管理系统体制教科书
本文还有配套的精品资源，点击获取简介：物流车辆定位管理系统利用信息技术提高物流效率和安全性。通过集成GPS技术进行实时车辆追踪和监控，它提供及时的货物运送和异常处理。系统的关键技术包括GPS车辆定位、C#编程语言、数据库管理、车辆管理、在途情况监控、预警与通知、数据分析与报告、用户界面设计、安全性与隐私保护以及系统集成。这些要素共同保障物流流程的高效、安全和智能化。1.物流车辆定位管理系统的应用与
Spring AI Alibaba 快速入门指南（适合初学者）会飞的架狗师 AI spring 人工智能 java
如果你是刚接触AI开发或Spring框架的初学者，不用担心，本指南会用简单易懂的语言带你一步步了解并使用SpringAIAlibaba。一、什么是SpringAIAlibaba（小白也能懂）简单来说，SpringAIAlibaba就是一个“工具包”，它把阿里巴巴的AI技术（比如通义千问大模型、向量数据库等）和大家常用的Spring框架“打包”到了一起。**打个比方：**就像你想做蛋糕（开发AI应用
Java朴实无华按天计划从入门到实战（强化速战版-66天）岫珩 Java 后端 java 开发语言学习 Java 时间安排学习计划
致敬读者感谢阅读笑口常开生日快乐⬛早点睡觉博主相关博主信息博客首页专栏推荐活动信息文章目录Java朴实无华按天计划从入门到实战（强化速战版-66天）1.基础（18）1.1JavaSE核心（5天）1.2数据库与SQL（5天）1.3前端基础（8天）2.进阶（17天）2.1JavaWeb核心（5天）2.2Mybatis与Spring全家桶（6天）2.3中间件入门（4天）2.4实践项目（2天）3.高阶（1
linux实战--日志管理
简介日志文件重要的信息系统文件，及了许多重要的系统事件，包括用户的登录信息，系统的启动信息，系统的安全信息，邮寄相关信息，各种服务相关的信息。日志对安全也很重要。每天记录系统发生的各种事情，通过日志检查错误发生的原因或受到攻击时攻击者留下的痕迹。总的来说，日志是记录重大事件的文件。处理日志的工具rsyslog系统日志管理专职管理日志的工具，它产生各种信息文件，主要存放在/var/loglogrot
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S