MySQL的索引优化分析(二)

一、索引优化

1，单表索引优化

建表

CREATE TABLE IF NOT EXISTS article(

    id INT(10) UNSIGNED NOT NULL PRIMARY KEY AUTO_INCREMENT,

    author_id INT(10) UNSIGNED NOT NULL,

    category_id INT(10) UNSIGNED NOT NULL,

    views INT(10) UNSIGNED NOT NULL,

    comments INT(10) UNSIGNED NOT NULL,

    title VARCHAR(255) NOT NULL,

    content TEXT NOT NULL

);

INSERT INTO article(author_id,category_id,views,comments,title,content)

VALUES

(1,1,1,1,'1','1'),

(2,2,2,2,'2','2'),

(1,1,3,3,'3','3');

查询案例

查询category_id为1且comments 大于1的情况下，views最多的article_id。
查询语句：SELECT id, author_id FROM article WHERE category_id = 1 AND comments > 1 ORDER BY views DESC LIMIT 1;
分析语句：EXPLAIN SELECT id, author_id FROM article WHERE category_id = 1 AND comments > 1 ORDER BY views DESC LIMIT 1;

分析：可看到上述type为ALL，证明未命中索引，并且Using filesort使用了文件排序。故而可进行优化到使用索引。

优化一：

创建索引：CREATE INDEX idx_article_ccv ON article(category_id,comments,views);
查看当前索引：SHOW INDEX FROM article;

查看执行计划：EXPLAIN SELECT id, author_id FROM article WHERE category_id = 1 AND comments > 1 ORDER BY views DESC LIMIT 1;

分析：删除索引：DROP INDEX idx_article_ccv ON article;
- 因为按照B+Tree索引的工作原理，先排序 category_id，如果遇到相同的 category_id 则再排序comments，如果遇到相同的 comments 则再排序 views。
- 最左前缀匹配原则，当comments字段在联合索引里处于中间位置时，因为comments>1条件是一个范围值（所谓 range），MySQL 无法利用索引再对后面的views部分进行检索，即 range 类型查询字段后面的索引无效。
- 如果将条件comments > 1改成comments = 1，则当前索引为类型为ref，并且不存在filesort。但是不满足题意

优化二：

创建索引：create index idx_article_ccv on article(category_id, views);
查看当前索引：SHOW INDEX FROM article;

再次查看执行计划：EXPLAIN SELECT id, author_id FROM article WHERE category_id = 1 AND comments > 1 ORDER BY views DESC LIMIT 1;

可看到此时满足条件，为方便后续测试此时依然删除当前索引：DROP INDEX idx_article_ccv ON article;

2，两表索引优化

建表

CREATE TABLE IF NOT EXISTS class(

    id INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,

    card INT(10) UNSIGNED NOT NULL,

    PRIMARY KEY(id)

);

CREATE TABLE IF NOT EXISTS book(

    bookid INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,

    card INT(10) UNSIGNED NOT NULL,

    PRIMARY KEY(bookid)

);

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO class(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO book(card) VALUES(FLOOR(1+(RAND()*20)));

查询案例

实现两表的连接，连接条件是 class.card = book.card
查询语句：SELECT * FROM class LEFT JOIN book ON class.card = book.card;
分析语句：EXPLAIN SELECT * FROM class LEFT JOIN book ON class.card = book.card;

分析：type 有 ALL ，rows 为表中数据总行数，说明 class 和 book 进行了全表检索

添加右表索引

CREATE INDEX idx_book_card ON book(card);
分析语句：EXPLAIN SELECT * FROM class LEFT JOIN book ON class.card = book.card;

分析：满足条件，故而删除当前索引，方便后续测试：DROP INDEX idx_book_card ON book;
- 这是由左连接特性决定的。LEFT JOIN条件用于确定如何从右表搜索行，左边一定都有，所以右边是我们的关键点，一定需要建立索引。
- 左表连接右表，则需要拿着左表的数据去右表里面查，索引需要在右表中建立索引

添加左表索引

CREATE INDEX idx_class_card ON class(card);
分析语句：EXPLAIN SELECT * FROM class LEFT JOIN book ON class.card = book.card;

分析：有上图可看出来索引未起到太大的作用，因为是左连接。左表驱动右边的时候由于左表不论如何都需要循环遍历，故而rows还是原来的，其实这样并没有太大的效果
将左连接转成右连接：EXPLAIN SELECT * FROM class RIGHT JOIN book ON class.card = book.card;

分析：满足条件方便，后续测试删除当前索引：DROP INDEX idx_class_card ON class
- 这是因为RIGHT JOIN条件用于确定如何从左表搜索行，右边一定都有，所以左边是我们的关键点，一定需要建立索引。
- class RIGHT JOIN book ：book 里面的数据一定存在于结果集中，我们需要拿着 book 表中的数据，去 class 表中搜索，所以索引需要建立在 class 表中

3，三表索引优化

建表

CREATE TABLE IF NOT EXISTS phone(

    phoneid INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,

    card INT(10) UNSIGNED NOT NULL,

    PRIMARY KEY(phoneid)

)ENGINE=INNODB;

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

INSERT INTO phone(card) VALUES(FLOOR(1+(RAND()*20)));

查询案例：

实现三表联查：SELECT * FROM class LEFT JOIN book ON class.card = book.card LEFT JOIN phone ON book.card = phone.card
分析语句：EXPLAIN SELECT * FROM class LEFT JOIN book ON class.card = book.card LEFT JOIN phone ON book.card = phone.card

结论：
- type 有ALL，rows 为表数据总行数，说明 class、 book 和 phone 表都进行了全表检索
- Extra 中 Using join buffer ，表明连接过程中使用了 join 缓冲区

创建索引：

ALTER TABLE book ADD INDEX x (card);

ALTER TABLE phone ADD INDEX y (card);

分析语句：EXPLAIN SELECT * FROM class LEFT JOIN book ON class.card = book.card LEFT JOIN phone ON book.card = phone.card

分析：进行 LEFT JOIN ，永远都在右表的字段上建立索引

4，总结

　　将 left join 看作是两层嵌套 for 循环

尽可能减少Join语句中的NestedLoop的循环总次数；
永远用小结果集驱动大的结果集（在大结果集中建立索引，在小结果集中遍历全表）；
优先优化NestedLoop的内层循环；
保证Join语句中被驱动表上Join条件字段已经被索引；
当无法保证被驱动表的Join条件字段被索引且内存资源充足的前提下，不要太吝惜JoinBuffer的设置；

二、索引失效

创建表：

CREATE TABLE staffs(

    id INT PRIMARY KEY AUTO_INCREMENT,

    `name` VARCHAR(24)NOT NULL DEFAULT'' COMMENT'姓名',

    `age` INT NOT NULL DEFAULT 0 COMMENT'年龄',

    `pos` VARCHAR(20) NOT NULL DEFAULT'' COMMENT'职位',

    `add_time` TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT'入职时间'

)CHARSET utf8 COMMENT'员工记录表';

INSERT INTO staffs(`name`,`age`,`pos`,`add_time`) VALUES('z3',22,'manager',NOW());

INSERT INTO staffs(`name`,`age`,`pos`,`add_time`) VALUES('July',23,'dev',NOW());

INSERT INTO staffs(`name`,`age`,`pos`,`add_time`) VALUES('2000',23,'dev',NOW());

1，索引失效准则

全值匹配我最爱
最佳左前缀法则：如果索引了多例，要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中的列。
不在索引列上做任何操作（计算、函数、（自动or手动）类型转换），会导致索引失效而转向全表扫描
存储引擎不能使用索引中范围条件右边的列
尽量使用覆盖索引（只访问索引的查询（索引列和查询列一致）），减少select *
mysql在使用不等于（!=或者<>）的时候无法使用索引会导致全表扫描(并不绝对，需考虑成本问题，例如id!=''时还是会用到索引的)
is null，is not null 也无法使用索引（并不绝对，需考虑成本问题）
like以通配符开头（’%abc…’）mysql索引失效会变成全表扫描操作(如果是'a%'则使用range索引)
字符串不加引号索引失效
少用or，用它连接时会索引失效

2，索引失效案例

a)创建复合索引

#创建复合索引

ALTER TABLE staffs ADD INDEX index_staffs_nameAgePos(`name`,`age`,`pos`);

#查看索引

SHOW INDEX FROM staffs;

b)where条件匹配

当顺序匹配时：

当不存在最左索引（name）时：可以看到此时索引失效

当中间索引不存在（age）时：可以看到此时有效索引只有一个const，即：只有name有效

当再索引列上计算或者使用函数时，会导致索引失效：使用left(name,4)='July'

当使用范围索引之后，后续的索引就会失效：name条件不变，把age由原来的等于变成大于，此时索引类型就由ref -> range

尽量使用覆盖索引（只访问索引的查询（索引列和查询列一致）），减少 select *

like中使用%的位置决定是否使用索引(如果%在左边或者左右都有索引会失效，如果%只在右边索引有效)

- 如果确实是需要将%放在左边可采用覆盖索引优化(只查询需要的列并命中到索引上)

字符串不加单引号索引失效：name=2000和name='2000'

少用or，用它连接时会索引失效

mysql在使用不等于（!=或者<>）的时候无法使用索引会导致全表扫描(当然也并不绝对，这里有一个回执成本问题)

is null，is not null 会导致索引失效：key = null 表示索引失效(并不绝对，会考虑成本问题)

注意在in、!=、is null和is not null，到底什么时候索引，什么时候采用全表扫描呢？　详情描述请点击查看

成本。对于使用二级索引（innodb）进行查询来说，成本组成主要有两个方面：

    读取二级索引记录的成本

    将二级索引记录执行回表操作，也就是到聚簇索引中找到完整的用户记录的操作所付出的成本。

很显然，要扫描的二级索引记录条数越多，那么需要执行的回表操作的次数也就越多，达到了某个比例时，使用二级索引执行查询的成本也就超过了全表扫描的成本

（举一个极端的例子，比方说要扫描的全部的二级索引记录，那就要对每条记录执行一遍回表操作，自然不如直接扫描聚簇索引来的快）。

所以MySQL优化器在真正执行查询之前，对于每个可能使用到的索引来说，都会预先计算一下需要扫描的二级索引记录的数量。所以对于以上三种查询条件是否会命中索引就取决于二级索引查询的成本与全局查询成本的高低。

三、索引案例

1，建表

create table test03(

    id int primary key not null auto_increment,

    c1 char(10),

    c2 char(10),

    c3 char(10),

    c4 char(10),

    c5 char(10)

);

insert into test03(c1,c2,c3,c4,c5) values ('a1','a2','a3','a4','a5');

insert into test03(c1,c2,c3,c4,c5) values ('b1','b2','b3','b4','b5');

insert into test03(c1,c2,c3,c4,c5) values ('c1','c2','c3','c4','c5');

insert into test03(c1,c2,c3,c4,c5) values ('d1','d2','d3','d4','d5');

insert into test03(c1,c2,c3,c4,c5) values ('e1','e2','e3','e4','e5');

#创建复合索引

create index idx_test03_c1234 on test03(c1,c2,c3,c4);

2，案例

#只有where

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' AND c3='a3' AND c4='a4';

EXPLAIN SELECT * FROM test03 WHERE c4='a4' AND c3='a3' AND c2='a2' AND c1='a1';

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' AND c3>'a3' AND c4='a4';

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' AND c4>'a4' AND c3='a3';

#where条件与order by 结合

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' AND c4='a4' ORDER BY c3;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' ORDER BY c3;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' ORDER BY c4;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c5='a5' ORDER BY c2, c3;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c5='a5' ORDER BY c3, c2;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' ORDER BY c2, c3;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' AND c5='a5' ORDER BY c2, c3;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c2='a2' AND c5='a5' ORDER BY c3, c2;

#where与group by结合

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c4='a4' GROUP BY c2, c3;

EXPLAIN SELECT * FROM test03 WHERE c1='a1' AND c4='a4' GROUP BY c3, c2;

3，案例分析

a）where查询

b）where与order by结合

c）where与group by

　　结论：group by 基本上都需要进行排序(使用情况基本与order by相同，索引顺序均会出现在where之后)，但凡使用不当，会有临时表产生。

4，索引失效总结

a)建议

对于单键索引，尽量选择针对当前query过滤性更好的索引
在选择组合索引的时候，当前query中过滤性最好的字段在索引字段顺序中，位置越靠左越好。
在选择组合索引的时候，尽量选择可以能包含当前query查询条件中where子句更多字段的索引
尽可能通过分析统计信息和调整query的写法来达到选择合适索引的目的

b)案例

MySQL的索引优化分析(二)的更多相关文章

MySQL的索引优化分析(一)
一.SQL分析性能下降.SQL慢.执行时间长.等待时间长查询语句写的差索引失效关联查询太多join(设计缺陷) 单值索引:在user表中给name属性创建索引,create index idx_ ...
【mysql】索引优化分析
1. 索引的概念 1.1 索引是什么 MySQL 官方对索引的定义为:索引(Index)是帮助MySQL 高效获取数据的数据结构.可以得到索引的本质:索引是数据结构.可以简单理解为排好序的快速查找数据 ...
Mysql 索引优化分析
MySQL索引优化分析为什么你写的sql查询慢?为什么你建的索引常失效?通过本章内容,你将学会MySQL性能下降的原因,索引的简介,索引创建的原则,explain命令的使用,以及explain输出字 ...
mySql索引优化分析
MySQL索引优化分析为什么你写的sql查询慢?为什么你建的索引常失效?通过本章内容,你将学会MySQL性能下降的原因,索引的简介,索引创建的原则,explain命令的使用,以及explain输出字 ...
【MySQL 高级】索引优化分析
MySQL高级索引优化分析 SQL 的效率问题出现性能下降,SQL 执行慢,执行时间长,等待时间长等情况,可能的原因有: 查询语句写的不好索引失效单值索引:在 user 表中给 name 属性 ...
知识点：Mysql 数据库索引优化实战(4)
知识点:Mysql 索引原理完全手册(1) 知识点:Mysql 索引原理完全手册(2) 知识点:Mysql 索引优化实战(3) 知识点:Mysql 数据库索引优化实战(4) 一:插入订单业务逻辑:插 ...
MySQL高级第二章——索引优化分析
一.SQL性能下降原因 1.等待时间长?执行时间长? 可能原因: 查询语句写的不行索引失效(单值索引.复合索引) CREATE INDEX index_user_name ON user(name) ...
MySQL高级学习笔记（四）：索引优化分析
文章目录性能下降 SQL慢执行时间长等待时间长查询语句写的烂查询数据过多关联了太多的表,太多join 没有利用到索引单值复合服务器调优及各个参数设置(缓冲.线程数等)(不重要DBA的 ...
mysql数据库索引优化与实践（一）
前言 mysql数据库是现在应用最广泛的数据库系统.与数据库打交道是每个Java程序员日常工作之一,索引优化是必备的技能之一. 为什么要了解索引真实案例案例一:大学有段时间学习爬虫,爬取了知乎30 ...

随机推荐

nginx学习之——信号控制和配置
一.信号控制 1)TERM, INT Quick shutdown \\麻溜停掉(暴力停止),一般不常用 // 启动和停止nginx 当前目录:/usr/local/bin/nginx 启动: ...
Notepad++ 使用步骤，熟练掌握notepad++的使用技巧，无疑会大大提升专业技能。以及快捷键操作
官方下载地址: https://notepad-plus.en.softonic.com/ 1.安装双击安装包出现以下界面 2.点击我接受 3.安装地址继续下一步 4.默认即可,继续下一步 5.根 ...
2020传智博黑马python课
网上花钱买来的资源,免费分享给冷冷的兄弟们! 已经把相关网站广告后缀名全部替换修改,现在文件已经全部没有广告了, 不过就是课件的压缩包需要密码,已经在该文件夹说明,大家放心使用, 文件清爽,文件名 ...
Day4 dict和set
dict -- dictionary 一组key的集合,包含key与value的对应. Python内置的字典,在其他语言中称为map,使用key-value存储,具有极快的查找 ...
Sharding-JDBC分库分表简单示例
1. 简介 Sharding是一个简单的分库分表中间件,它不需要依赖于其他的服务,即可快速应用在实际项目的分库分表策略中. 2. 初始化数据库(db0.db1.db2) 1 #创建数据库db0 2 C ...
mybatis-plus快速入门并使用
目录 mybatis-plus的初次使用总结说明:官网自有黄金屋,深入学习看官网是必须的,废话不多说环境:springboot.mysql 一.配置 pom yml配置数据库二.代码生成器生成 ...
Docker安装RabbitMQ与Kafka
RabbitMq安装(dokcer) 下载镜像 docker pull rabbitmq 创建并启动容器 docker run -d --name rabbitmq -p 5672:5672 -p 1 ...
热部署Devtools
在子工程添加devtools的依赖 <dependency> <groupId>org.springframework.boot</groupId> <art ...
vue-router 路由传参的几种方式，刷新页面参数丢失
常见场景:点击列表详情,跳转到详情内页,传递id参数获取详情数据. 我们先来看看路由跳转的几种方式: 1.通过params方式传参通过$route.push的path携带参数方式 // 路由配置 { ...
Docker 部署 _实现每日情话定时推送（apscheduler）
由于最近工作比较忙,后续博客可能更新不及时,哈哈前言: 由于python对于微信推送不够友好,需要扫码登录,短信接口需要RMB.我就想到了qq邮箱发送到好友,然而微信有qq邮箱提醒功能,就实现了我需 ...

MySQL的索引优化分析(二)

一、索引优化

1，单表索引优化

建表

查询案例

优化一：

优化二：

2，两表索引优化

建表

查询案例

添加右表索引

添加左表索引

3，三表索引优化

建表

查询案例：

创建索引：

4，总结

二、索引失效

1，索引失效准则

2，索引失效案例

a)创建复合索引

b)where条件匹配

三、索引案例

1，建表

2，案例

3，案例分析

a）where查询

b）where与order by结合

c）where与group by

4，索引失效总结

a)建议

b)案例

MySQL的索引优化分析(二)的更多相关文章

随机推荐

热门专题