SQL优化与诊断

Explain诊断

Explain各参数的含义如下：

列名	说明
id	执行编号，标识select所属的行。如果在语句中没有子查询或关联查询，只有唯一的select，每行都将显示1.否则，内层的select语句一般会顺序编号，对应于其在原始语句中的位置
select_type	显示本行是简单或复杂select，如果查询有任何复杂的子查询，则最外层标记为PRIMARY（DERIVED、UNION、UNION RESUIT）
table	访问引用哪个表（引用某个查询，如“derived3”）
type	数据访问/读取操作类型（All、index、range、ref、eq_ref、const/system、NULL）
possible_key	揭示哪一些索引可能有利于高效的查找
key	显示mysql实际决定采用哪个索引来优化查询
key_len	显示mysql在索引里使用的字节数
ref	显示了之前的表在key列记录的索引中查找值所用的列或常量
rows	为了找到所需要的行而需要读取的行数，估算值
Extra	额外信息，如using index、filesort等

select_type 常见类型及其含义

SIMPLE：不包含子查询或者 UNION 操作的查询
PRIMARY：查询中如果包含任何子查询，那么最外层的查询则被标记为 PRIMARY
SUBQUERY：子查询中第一个 SELECT
DEPENDENT SUBQUERY：子查询中的第一个 SELECT，取决于外部查询
UNION：UNION 操作的第二个或者之后的查询
DEPENDENT UNION：UNION 操作的第二个或者之后的查询,取决于外部查询
UNION RESULT：UNION 产生的结果集
DERIVED：出现在 FROM 字句中的子查询

type常见类型及其含义

system：这是 const 类型的一个特例，只会出现在待查询的表只有一行数据的情况下
consts：常出现在主键或唯一索引与常量值进行比较的场景下，此时查询性能是最优的
eq_ref：当连接使用的是完整的索引并且是 PRIMARY KEY 或 UNIQUE NOT NULL INDEX 时使用它
ref：当连接使用的是前缀索引或连接条件不是 PRIMARY KEY 或 UNIQUE INDEX 时则使用它
ref_or_null：类似于 ref 类型的查询，但是附加了对 NULL 值列的查询
index_merge：该联接类型表示使用了索引进行合并优化
range：使用索引进行范围扫描，常见于 between、> 、< 这样的查询条件
index：索引连接类型与 ALL 相同，只是扫描的是索引树，通常出现在索引是该查询的覆盖索引的情况
ALL：全表扫描，效率最差的查找方式

阿里编码规范要求：至少要达到 range 级别，要求是 ref 级别，如果可以是 consts 最好

key列

实际在查询中是否使用到索引的标志字段

如何查看Mysql优化器优化之后的SQL

# 仅在服务器环境下或通过Navicat进入命令列界面

explain extended  SELECT * FROM `student` where `name` = 1 and `age` = 1;

# 再执行

show warnings;

# 结果如下：

/* select#1 */ select `mytest`.`student`.`age` AS `age`,`mytest`.`student`.`name` AS `name`,`mytest`.`student`.`year` AS `year` from `mytest`.`student` where ((`mytest`.`student`.`age` = 1) and (`mytest`.`student`.`name` = 1))

复制代码

为什么要做这个事呢？我们知道Mysql有一个最左匹配原则，那么如果我的索引建的是age，name，那我以name，age这样的顺序去查询能否使用到索引呢？实际上是可以的，就是因为Mysql查询优化器可以帮助我们自动对SQL的执行顺序等进行优化，以选取代价最低的方式进行查询（注意是代价最低，不是时间最短）

SQL优化

超大分页场景解决方案

如表中数据需要进行深度分页，如何提高效率？在阿里出品的Java编程规范中写道：

利用延迟关联或者子查询优化超多分页场景

说明：MySQL 并不是跳过 offset 行，而是取 offset+N 行，然后返回放弃前 offset 行，返回 N 行，那当 offset 特别大的时候，效率就非常的低下，要么控制返回的总页数，要么对超过特定阈值的页数进行 SQL 改写

# 反例（耗时129.570s）

select * from task_result LIMIT 20000000, 10;

# 正例（耗时5.114s）

SELECT a.* FROM task_result a, (select id from task_result LIMIT 20000000, 10) b where a.id = b.id;

# 说明

task_result表为生产环境的一个表，总数据量为3400万，id为主键，偏移量达到2000万

复制代码

获取一条数据时的Limit 1

如果数据表的情况已知，某个业务需要获取符合某个Where条件下的一条数据，注意使用Limit

说明：在很多情况下我们已知数据仅存在一条，此时我们应该告知数据库只用查一条，否则将会转化为全表扫描

# 反例（耗时2424.612s）

select * from task_result where unique_key = 'ebbf420b65d95573db7669f21fa3be3e_861414030800727_48';

# 正例（耗时1.036s）

select * from task_result where unique_key = 'ebbf420b65d95573db7669f21fa3be3e_861414030800727_48' LIMIT 1;

# 说明

task_result表为生产环境的一个表，总数据量为3400万，where条件非索引字段，数据所在行为第19486条记录

复制代码

批量插入

# 反例

INSERT into person(name,age) values('A',24)

INSERT into person(name,age) values('B',24)

INSERT into person(name,age) values('C',24)

# 正例

INSERT into person(name,age) values('A',24),('B',24),('C',24);

# 说明

比较常规，就不多做说明了

复制代码

like语句的优化

like语句一般业务要求都是 '%关键字%'这种形式，但是依然要思考能否考虑使用右模糊的方式去替代产品的要求，其中阿里的编码规范提到：

页面搜索严禁左模糊或者全模糊，如果需要请走搜索引擎来解决

# 反例（耗时78.843s）

EXPLAIN select * from task_result where taskid LIKE '%tt600e6b601677b5cbfe516a013b8e46%' LIMIT 1;

# 正例（耗时0.986s）

select * from task_result where taskid LIKE 'tt600e6b601677b5cbfe516a013b8e46%' LIMIT 1

##########################################################################

# 对正例的Explain

1	SIMPLE	task_result		range	adapt_id	adapt_id	98		99	100.00	Using index condition

# 对反例的Explain

1	SIMPLE	task_result		ALL					                    33628554	11.11	Using where

# 说明

task_result表为生产环境的一个表，总数据量为3400万，taskid是一个普通索引列，可见%%这种匹配方式完全无法使用索引，从而进行全表扫描导致效率极低，而正例通过索引查找数据只需要扫描99条数据即可

复制代码

避免SQL中对where字段进行函数转换或表达式计算

# 反例

select * from task_result where id + 1 = 15551;

# 正例

select * from task_result where id = 15550;

##########################################################################

# 对正例的Explain

1	SIMPLE	task_result		const	PRIMARY	PRIMARY	8	const	1	100.00	

# 对反例的Explain

1	SIMPLE	task_result		ALL					                33631512  100.00	Using where

# 说明

其实在知道了有SQL优化器之后，我个人感觉这种普通的表达式转换应该可以提前进行处理再进行查询，这样一来就可以用到索引了，但是问题又来了，如果mysql优化器可以提前计算出结果，那么写sql语句的人也一定可以提前计算出结果，所以矛盾点在这个地方，导致5.7版本以前的此种情况都无法使用索引吧，未来可能会对其进行优化

复制代码

使用 ISNULL()来判断是否为 NULL 值

说明：NULL 与任何值的直接比较都为 NULL

# 1） NULL<>NULL 的返回结果是 NULL，而不是 false。

# 2） NULL=NULL 的返回结果是 NULL，而不是 true。

# 3） NULL<>1 的返回结果是 NULL，而不是 true。

复制代码

多表查询

我所在的公司基本禁止了多表查询，那如果必须使用到的话，我们可以一起参考一下阿里的编码规范

Eg：超过三个表禁止 join。需要 join 的字段，数据类型必须绝对一致；多表关联查询时，保证被关联的字段需要有索引

明明有索引为什么还走全表扫描

之前回答一些面试问题的时候，对某一个点的理解出现了偏差，即我认为只要查询的列有索引则一定会使用索引去Push数据

然而实际上不仅仅是这样，真正应该是：针对查询的数据行占总数据量过多时会转化成全表查询

那么这个过多指代的是多少呢？

我的测试结果是50%，但个人认为MySQL优化器不会完全纠结于行数区分是否全表，而是有很多其他因素综合考虑发现全表扫描的效率更高等等，所以充分认识到该问题即可

count(*) 还是 count(id)

阿里的Java编码规范中有以下内容：

【强制】不要使用 count(列名) 或 count(常量) 来替代 count(*)

count(*) 是 SQL92 定义的标准统计行数的语法，跟数据库无关，跟 NULL 和非 NULL 无关。

说明：count(*)会统计值为 NULL 的行，而 count(列名)不会统计此列为 NULL 值的行

字段类型不同导致索引失效

阿里的Java编码规范中有以下内容：

【推荐】防止因字段类型不同造成的隐式转换，导致索引失效

实际上数据库在查询的时候会作一层隐式的转换，比如 varchar 类型字段通过数字去查询

# 正例

EXPLAIN SELECT * FROM `user_coll` where pid = '1';

type：ref

ref：const

rows:1

Extra:Using index condition

# 反例

EXPLAIN SELECT * FROM `user_coll` where pid = 1;

type：index

ref：NULL

rows:3(总记录数)

Extra:Using where; Using index

# 说明

pid字段有相应索引，且格式为varchar

复制代码

关于

感谢以下博文及其作者：

干货！SQL性能优化，书写高质量SQL语句

干货！SQL性能优化，书写高质量SQL语句（二）

MySQL官方文档

Tips

自建数据表进行测试

CREATE TABLE `student` (

  `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键',

  `name` varchar(255) NOT NULL,

  `class` varchar(255) DEFAULT NULL,

  `page` bigint(20) DEFAULT NULL,

  `status` tinyint(3) unsigned NOT NULL COMMENT '状态：0 正常，1 冻结，2 删除',

  PRIMARY KEY (`id`)

) ENGINE=InnoDB AUTO_INCREMENT=0 DEFAULT CHARSET=utf8mb4

复制代码

插入数据

DELIMITER ;;

    CREATE PROCEDURE insertData()

    BEGIN

        declare i int;

        set i = 1 ;

        WHILE (i < 1000000) DO

            INSERT INTO student(`name`,class,`page`,`status`)

                VALUES(CONCAT('class_', i),

                    CONCAT('class_', i),

                i, (SELECT FLOOR(RAND() * 2)));

            set i = i + 1;

        END WHILE;

        commit;

		END;;

CALL insertData();

点我直通掘金~

没内鬼，来点干货！SQL优化和诊断的更多相关文章

没内鬼，来点干货！volatile和synchronized
题外话这篇笔记是我<没内鬼>系列第二篇,其实我计划是把设计模式和多线程并发分为两个系列,统一叫<一起学系列>来系统的介绍相关的知识,但是想到这篇笔记去年就写成了,一直不发心 ...
【重磅干货】看了此文，Oracle SQL优化文章不必再看！
目录 SQL优化的本质 SQL优化Road Map 2.1 制定SQL优化目标 2.2 检查执行计划 2.3 检查统计信息 2.4 检查高效访问结构 2.5 检查影响优化器的参数 2.6 SQL语句编 ...
当谈 SQL 优化时谈些什么？
欢迎大家关注腾讯云技术社区-博客园官方主页,我们将持续在博客园为大家推荐技术精品文章哦~ 作者:孙银行背景 Mysql数据库作为数据持久化的存储系统,在实际业务中应用广泛.在应用也经常会因为SQL遇 ...
SQL优化：索引的重要性
开篇小测验下面这样一个小SQL 你该怎么样添加最优索引两个表上现在只有聚集索引 bigproduct 表上已经有聚集索引 ProductID bigtransactionhistory 表上已经有 ...
面试官：不会sql优化？出门右转顺便带上门，谢谢
导读作为一个后端程序员,数据库这个东西是绕不开的,特别是写sql的能力,如果您参加过多次面试,那么一定会从面试复盘中发现面试官总是会考察到sql优化这个东西. 我在之前的多次面试中最常遇到的一个问题 ...
sql 优化
1.选择最有效率的表名顺序(只在基于规则的优化器中有效): oracle的解析器按照从右到左的顺序处理 from 子句中的表名,from子句中写在最后的表(基础表driving table)将被最先处 ...
(转)SQL 优化原则
一.问题的提出在应用系统开发初期,由于开发数据库数据比较少,对于查询SQL语句,复杂视图的的编写等体会不出SQL语句各种写法的性能优劣,但是如果将应用系统提交实际应用后,随着数据库中数据的增加,系 ...
提高SQL查询效率(SQL优化)
要提高SQL查询效率where语句条件的先后次序应如何写 http://blog.csdn.net/sforiz/article/details/5345359 我们要做到不但会写SQL,还要做到 ...
基于Oracle的SQL优化（社区万众期待数据库优化扛鼎巨著）
基于Oracle的SQL优化(社区万众期待数据库优化扛鼎巨著) 崔华编 ISBN 978-7-121-21758-6 2014年1月出版定价:128.00元 856页 16开编辑推荐本土O ...

随机推荐

【Python爬虫】HTTP基础和urllib库、requests库的使用
引言: 一个网络爬虫的编写主要可以分为三个部分: 1.获取网页 2.提取信息 3.分析信息本文主要介绍第一部分,如何用Python内置的库urllib和第三方库requests库来完成网页的获取.阅 ...
有关 HashMap 面试会问的一切
前言 HashMap 是无论在工作还是面试中都非常常见常考的数据结构. 比如 Leetcode 第一题 Two Sum 的某种变种的最优解就是需要用到 HashMap 的,高频考题 LRU Cache ...
Accelerate Framework in Swift
介绍: 最近看到这篇文章有对Accelerate框架有一个介绍,自己也按照作者给的思路整理了一遍,也算是对这一框架的一个重新的回顾和学习,在以前研究AR先关只是的时候有接触到这个框架,赞具体里面的东西 ...
题解 - 【NOI2015】维修数列
题面大意: 使用平衡树维护一个数列,支持插入,修改,删除,翻转,求和,求最大和这 \(6\) 个操作. 题意分析: Splay 裸题,几乎各种操作都有了,这个代码就发给大家当个模板吧. 最后求最大和的 ...
java基础-循环标签
outer: for innter: for break outer//跳出整个循环: continue outer//结束本次外循环的循环 break inner; continute inner; ...
MarkDown编辑器的区别对比
标题: MarkDown编辑器的区别对比作者: 梦幻之心星 sky-seeker@qq.com 标签: [MarkDown, 编辑器,区别] 目录: [软件] 日期: 2020-6-22 前提说明 ...
SQL注入之常用工具sqlmap
通常来说,验证一个页面是否存在注入漏洞比较简单,而要获取数据,扩大权限,则要输入很复杂的SQL语句,有时候我们还会对大量的URL进行测试,这时就需要用到工具来帮助我们进行注入了. 目前流行的注入工具有 ...
前端开发神器Charles从入门到卸载
前言本文将带大家学习使用前端开发神器-charles,从基本的下载安装到常见配置使用,为大家一一讲解. 一.花式夸奖Charles 截取 Http 和 Https 网络封包. 支持重发网络请求,方便 ...
JavaScript基础正则表达式的字面声明(012)
不出所料,正则表达式也是JavaScript的一种对象.构造正则表达式也有两种,一种是使用JavaScript内置的 new RegExp() 构造函数,另一种是我们推荐的字面声明方式: // reg ...
AnalyticDB实现和特点浅析
目录 AnalyticDB介绍与背景 AnalyticDB详细解析架构设计数据分区读写分离和读写流程其他特性介绍混合(列-行)存储引擎索引小结本篇主要是根据AnalyticDB的论文, ...

没内鬼，来点干货！SQL优化和诊断