sql优化及原理详解,五分钟读懂sql优化

在我而言这算是一个复习,然后总结出来给大家当个教材吧。
我也是看视频总结出来的笔记,所以说的都很简单和浅薄。有不全面或者偏颇的地方欢迎指出,共同交流进步哈。(因为我当时是看视频总结的笔记,所以可能说的比较杂乱,我尽量写的分明一点,在最后会附上笔记,忽略我字丑)

索引

索引是什么呢?它相当于字典的目录。
索引:index是帮助mysql高效获取数据的数据结构,索引是数据结构(树,默认是B树),hash等。
索引的弊端:事物都是两面的,有利必然有弊。

  1. 索引本身很大,可以存放在内存/硬盘中。通常存放在硬盘。
  2. 索引不是所有情况都适用的。不适合建立索引的字段有:
    • 少量数据
    • 频繁更新的字段
    • 很少使用的字段
  3. 索引会降低增删改的数据效率

索引的优势:索引有这么多弊端我们还使用的原因是因为优大于劣。

  1. 提高查询效率(正常一个业务,增删改加一起都不如查询应用的多哟)
  2. 降低cpu使用率(因为B树本身已经排好序了)

索引的分类:

  • 单值索引:单列,一个表可以有多个单值索引
  • 唯一索引:不能重复的,一般多是指id
  • 复合索引:多个列构成的索引,相当于二级目录
    这个符合索引还有一些衍生的概念,比如窄索引,宽索引。一般我们把1-2个列组成的索引叫做窄索引。2个列以上组成的索引叫做宽索引。设计索引的一个重要原则就是能用窄索引不用宽索引。

举个小例子让大家更理解复合索引:如果我把一个表中name,age这两个列做成复合索引(注意顺序很重要)。那么我们形成的目录一级目录是name,二级目录是age。在name相同时才会age再形成目录。因为它本身的排序不是像目录一样一行一行列出来的,所以我们尽量用目录来想像它比较好理解。下面是图解:

复合索引图解

这也就涉及到一个索引失效的问题。我们在创建的时候,字段A,B,C这样创建。那么A是一级目录,B是二级目录,C是三级目录。我们可以直接只查找A,也可以查找AB,ABC。但是如果直接查找B或者BC索引就会失效。想想你拿一个单词的第二个字母去英语字典里查找。。还用说什么了么?
索引的创建:
创建索引方法很多啊,尤其是现在各种可视化的出现。不过这里还是简单的写一下吧,毕竟当年也辛辛苦苦记了笔记。
方式一:create 索引类型 索引名 on 表(字段)

  • 单值索引:create index age_index on demo(age);
  • 唯一索引:create unique index id_index on demo(id);
  • 复合索引:create index name_age_index on demo(name,age);
    方式二:alter table 表 add 索引类型 索引名(字段)
  • 单值索引:alter table demo add index age_index(age)
  • 唯一索引:alter table demo add unique index id_index(id)
  • 复合索引:alter table demo add index age_name_index(age,name)

有几点注意的事项:

  1. alter是ddl,所以不需要commit
  2. 一个字段是primary key,默认是主键索引。
  3. 唯一索引可以是null,主键索引不可以。
  4. 删除索引:drop index 索引名 on 表。
  5. 查询索引:show index from 表。

这里说一下,上面说的方法都是原生的sql,比如我现在习惯使用navicat,所以可以直接操作。。爽的不行。


navicat直接创建索引

选择索引列,可多选可单选

索引的实现方式,刚就说了可以B树和hash

然后删除查询也都是直接可视的,方便的不得了。就不多说了。

引擎

mysql做例子,还有个引擎是可以优化的。mysql中引擎分两种:

  • InnoDB:事物优先(适合高并发,是行锁)
  • MyISAM:性能优先(表锁)
sql需要优化的点:
  • 性能低
  • 执行时间长
  • 等待时间长
  • sql语句欠佳(尤其是连接查询)
  • 索引失效或者索引无用
  • 服务器参数设置不合适
    这里要额外说一下sql语句的编写过程和解析过程:
    编写过程:select ——>dinstinct——>from——>join ——>on——>where——>group by——>having——>order by
    解析过程:form——>on——>join——>where——>group by——>having——>select——>distinct——>order by
    然后我们常说的sql优化,主要是优化字段类型,长度,索引等。
    分析sql执行计划:
    其实我们一个sql语句的执行过程是一套流程,因为我不太会用画图,所以还是用笔画图传上来吧
    查询语句执行过程

    由此可见,我们写的sql语句不是直接执行的,还要优化器自动优化一下。用explain关键字可以模拟优化器的执行语句。一会儿我们再说这个explain关键字查出来的东西。
    sql优化的规则:
  1. 多表查询时,先查数据量小的表。
  2. 子查询时,先查询内层在查询外层。
  3. sql语句优化级别从好到坏的等级:
    system>const>eq_ref>ref>range>index>all.

sql优化等级:

  1. system是个理想型。就跟语文试卷的一百分似的。不聊这个了。
  2. 当用主键查询/唯一查询时,是const级别的。这个就是我们能做到的最优的了。
  3. eq_ref:唯一性索引,对于索引键查询(有且只有一行数据返回),常见于主键索引和唯一索引(一对一表的外键)。
  4. ref:非唯一性索引,单值索引。就相当于一级目录。
  5. range:查询指定范围的行,where后面是个范围。这里要注意一点,in会让索引失效!!sql优化等级会变成all。
  6. index:只查询索引并且没有条件。比如上面age是索引了。然后 select age from demo;这个语句的优化等级就是index。
  7. all:这个没啥说的,就是没索引,全表扫描。
    8.在explain中Extra的值是Usingfilesort,UsingTemporary:这是一种特殊情况,不仅没优化还有额外的消耗就是这个(这个我没遇到过,但是能想象的到,比如查询A但是用B分组或者查询A用B排序)。

上面说的这些等级在explain中可以看到。

单表优化常用方法:

  1. 加索引
  2. 调整sql语句顺序
  3. 调整索引

多表优化常用方法:

  1. 小表驱动大表。
  2. 小表在左,大表在右。
    程序设计的原则:双循环中,外层用小表,内层用大表。
    有一点要注意的,使用like的时候,尽量以常量开头,如%开头则索引会失效。sql是否优化了可以通过explain查看。
BTree

因为上面也提到了b树,所以还是单独聊聊吧。其实我也不是很理解。只能说一个浅显的认识而已。这里也就是简单的说一下。
首先,B树不仅可以二叉,还可以三叉,多叉。而只要大于二叉的都叫做BTree。
据说三层BTree可以存放上百万数据。
BTree一般都指B+树,数据全部存放在叶节点中。(这里简单的一个三叉树图)

b树

好了,就写到这里吧,希望日后算法的知识会的更多以后能把B树这个坑填完~~~然后有不同意见或者自己理解的可以留言或者私聊。
全文手打,如果你觉得对你有帮助麻烦点个赞点个关注啥的~~

你可能感兴趣的:(sql优化及原理详解,五分钟读懂sql优化)