sql优化及原理详解，五分钟读懂sql优化

在我而言这算是一个复习，然后总结出来给大家当个教材吧。
我也是看视频总结出来的笔记，所以说的都很简单和浅薄。有不全面或者偏颇的地方欢迎指出，共同交流进步哈。（因为我当时是看视频总结的笔记，所以可能说的比较杂乱，我尽量写的分明一点，在最后会附上笔记，忽略我字丑）

索引

索引是什么呢？它相当于字典的目录。
索引：index是帮助mysql高效获取数据的数据结构，索引是数据结构（树，默认是B树），hash等。
索引的弊端:事物都是两面的，有利必然有弊。

索引本身很大，可以存放在内存/硬盘中。通常存放在硬盘。
索引不是所有情况都适用的。不适合建立索引的字段有：
- 少量数据
- 频繁更新的字段
- 很少使用的字段
索引会降低增删改的数据效率

索引的优势：索引有这么多弊端我们还使用的原因是因为优大于劣。

提高查询效率（正常一个业务，增删改加一起都不如查询应用的多哟）
降低cpu使用率（因为B树本身已经排好序了）

索引的分类：

单值索引：单列，一个表可以有多个单值索引
唯一索引：不能重复的，一般多是指id
复合索引：多个列构成的索引，相当于二级目录
这个符合索引还有一些衍生的概念，比如窄索引，宽索引。一般我们把1-2个列组成的索引叫做窄索引。2个列以上组成的索引叫做宽索引。设计索引的一个重要原则就是能用窄索引不用宽索引。

举个小例子让大家更理解复合索引：如果我把一个表中name，age这两个列做成复合索引（注意顺序很重要）。那么我们形成的目录一级目录是name，二级目录是age。在name相同时才会age再形成目录。因为它本身的排序不是像目录一样一行一行列出来的，所以我们尽量用目录来想像它比较好理解。下面是图解：

复合索引图解

这也就涉及到一个索引失效的问题。我们在创建的时候，字段A,B,C这样创建。那么A是一级目录，B是二级目录,C是三级目录。我们可以直接只查找A，也可以查找AB,ABC。但是如果直接查找B或者BC索引就会失效。想想你拿一个单词的第二个字母去英语字典里查找。。还用说什么了么？
索引的创建：
创建索引方法很多啊，尤其是现在各种可视化的出现。不过这里还是简单的写一下吧，毕竟当年也辛辛苦苦记了笔记。
方式一：create 索引类型索引名 on 表（字段）

单值索引：create index age_index on demo(age);
唯一索引：create unique index id_index on demo(id);
复合索引：create index name_age_index on demo(name,age);
方式二：alter table 表 add 索引类型索引名（字段）
单值索引：alter table demo add index age_index(age)
唯一索引：alter table demo add unique index id_index(id)
复合索引：alter table demo add index age_name_index(age,name)

有几点注意的事项：

alter是ddl，所以不需要commit
一个字段是primary key，默认是主键索引。
唯一索引可以是null，主键索引不可以。
删除索引：drop index 索引名 on 表。
查询索引：show index from 表。

这里说一下，上面说的方法都是原生的sql，比如我现在习惯使用navicat，所以可以直接操作。。爽的不行。

navicat直接创建索引

选择索引列，可多选可单选

索引的实现方式，刚就说了可以B树和hash

然后删除查询也都是直接可视的，方便的不得了。就不多说了。

引擎

mysql做例子，还有个引擎是可以优化的。mysql中引擎分两种：

InnoDB：事物优先（适合高并发，是行锁）
MyISAM：性能优先（表锁）

sql需要优化的点：

性能低
执行时间长
等待时间长
sql语句欠佳（尤其是连接查询）
索引失效或者索引无用
服务器参数设置不合适
这里要额外说一下sql语句的编写过程和解析过程：
编写过程：select ——>dinstinct——>from——>join ——>on——>where——>group by——>having——>order by
解析过程：form——>on——>join——>where——>group by——>having——>select——>distinct——>order by
然后我们常说的sql优化，主要是优化字段类型，长度，索引等。
分析sql执行计划：
其实我们一个sql语句的执行过程是一套流程，因为我不太会用画图，所以还是用笔画图传上来吧

查询语句执行过程

由此可见，我们写的sql语句不是直接执行的，还要优化器自动优化一下。用explain关键字可以模拟优化器的执行语句。一会儿我们再说这个explain关键字查出来的东西。
sql优化的规则：

多表查询时，先查数据量小的表。
子查询时，先查询内层在查询外层。
sql语句优化级别从好到坏的等级：
system>const>eq_ref>ref>range>index>all.

sql优化等级：

system是个理想型。就跟语文试卷的一百分似的。不聊这个了。
当用主键查询/唯一查询时，是const级别的。这个就是我们能做到的最优的了。
eq_ref：唯一性索引，对于索引键查询（有且只有一行数据返回），常见于主键索引和唯一索引（一对一表的外键）。
ref：非唯一性索引，单值索引。就相当于一级目录。
range：查询指定范围的行，where后面是个范围。这里要注意一点，in会让索引失效！！sql优化等级会变成all。
index：只查询索引并且没有条件。比如上面age是索引了。然后 select age from demo；这个语句的优化等级就是index。
all：这个没啥说的，就是没索引，全表扫描。
8.在explain中Extra的值是Usingfilesort，UsingTemporary：这是一种特殊情况，不仅没优化还有额外的消耗就是这个（这个我没遇到过，但是能想象的到，比如查询A但是用B分组或者查询A用B排序）。

上面说的这些等级在explain中可以看到。

单表优化常用方法：

加索引
调整sql语句顺序
调整索引

多表优化常用方法：

小表驱动大表。
小表在左，大表在右。
程序设计的原则：双循环中，外层用小表，内层用大表。
有一点要注意的，使用like的时候，尽量以常量开头，如%开头则索引会失效。sql是否优化了可以通过explain查看。

BTree

因为上面也提到了b树，所以还是单独聊聊吧。其实我也不是很理解。只能说一个浅显的认识而已。这里也就是简单的说一下。
首先，B树不仅可以二叉，还可以三叉，多叉。而只要大于二叉的都叫做BTree。
据说三层BTree可以存放上百万数据。
BTree一般都指B+树，数据全部存放在叶节点中。（这里简单的一个三叉树图）

b树

好了，就写到这里吧，希望日后算法的知识会的更多以后能把B树这个坑填完~~~然后有不同意见或者自己理解的可以留言或者私聊。
全文手打，如果你觉得对你有帮助麻烦点个赞点个关注啥的~~

sql优化及原理详解，五分钟读懂sql优化

索引

引擎

sql需要优化的点：

BTree

你可能感兴趣的:(sql优化及原理详解，五分钟读懂sql优化)