MySQL实验 内连接优化order by+limit 以及添加索引再次改进
MySQL实验 内连接优化order by+limit 以及添加索引再次改进
在进行子查询优化双参数limit时我萌生了测试更加符合实际生产需要的ORDER BY + LIMIT
的想法,或许我们也可以对ORDER BY + LIMIT
也进行适当优化
实验准备
使用MySQL官方的大数据库employees进行实验,导入该示例库见此
准备使用其中的employees表,先查看一下表结构和表内的记录数量
mysql> desc employees;
+------------+---------------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+------------+---------------+------+-----+---------+-------+
| emp_no | int(11) | NO | PRI | NULL | |
| birth_date | date | NO | | NULL | |
| first_name | varchar(14) | NO | | NULL | |
| last_name | varchar(16) | NO | | NULL | |
| gender | enum('M','F') | NO | | NULL | |
| hire_date | date | NO | | NULL | |
+------------+---------------+------+-----+---------+-------+
6 rows in set (0.00 sec)
mysql> select count(*) from employeed;
ERROR 1146 (42S02): Table 'employees.employeed' doesn't exist
mysql> select count(*) from employees;
+----------+
| count(*) |
+----------+
| 300024 |
+----------+
1 row in set (0.05 sec)
我们可以看到,只有主键emp_no有索引
实验过程
老版本explain推荐参考博客(即新版本默认explain extended)
使用未优化order by + limit
mysql> select * from employees order by birth_date limit 200000,10;
+--------+------------+------------+------------+--------+------------+
| emp_no | birth_date | first_name | last_name | gender | hire_date |
+--------+------------+------------+------------+--------+------------+
| 498507 | 1960-09-24 | Perla | Delgrange | M | 1989-12-08 |
| 494212 | 1960-09-25 | Susuma | Baranowski | M | 1989-05-15 |
| 496888 | 1960-09-25 | Rosalyn | Rebaine | M | 1985-11-27 |
| 497766 | 1960-09-25 | Matt | Atrawala | F | 1987-02-11 |
| 481404 | 1960-09-25 | Sanjeeva | Eterovic | F | 1986-06-05 |
| 483269 | 1960-09-25 | Mitchel | Pramanik | F | 1997-07-23 |
| 483270 | 1960-09-25 | Geoff | Gulik | F | 1993-11-25 |
| 59683 | 1960-09-25 | Supot | Millington | F | 1991-06-03 |
| 101264 | 1960-09-25 | Mansur | Atchley | F | 1990-05-22 |
| 92453 | 1960-09-25 | Khalid | Trystram | M | 1993-11-10 |
+--------+------------+------------+------------+--------+------------+
10 rows in set (0.20 sec)
mysql> explain select * from employees order by birth_date limit 200000,10;
+----+-------------+-----------+------------+------+---------------+------+---------+------+--------+----------+----------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+-----------+------------+------+---------------+------+---------+------+--------+----------+----------------+
| 1 | SIMPLE | employees | NULL | ALL | NULL | NULL | NULL | NULL | 299468 | 100.00 | Using filesort |
+----+-------------+-----------+------------+------+---------------+------+---------+------+--------+----------+----------------+
1 row in set, 1 warning (0.00 sec)
我们可以看到,未优化时使用的是全表扫描,花费0.2s
内连接优化
优化思路:我们可以利用主键emp_no的索引树,在索引树上将符合order by birth_date limit 200000,10
的元组(即,行)的主键找出来,再用内连接返回10行emp_no的所有信息。
(内连接只返回表中与连接条件相匹配的行,也就是说,select emp_no from employees order by birth_date limit 200000,10
只会返回10个emp_no,那么内连接后,结果集中也只有10个emp_no对应的所有信息)
(另外这里的内连接时使用了emp_no,即,子查询中也有"覆盖索引"减少磁盘I/O的功劳)
mysql> select * from employees inner join (select emp_no from employees order by birth_date limit 200000,10) as temp_table using (emp_no);
+--------+------------+------------+-----------+--------+------------+
| emp_no | birth_date | first_name | last_name | gender | hire_date |
+--------+------------+------------+-----------+--------+------------+
| 427365 | 1960-09-24 | Yuping | Sethi | M | 1990-06-21 |
| 424219 | 1960-09-25 | Woody | Bernini | M | 1989-03-10 |
| 469218 | 1960-09-25 | George | Plotkin | M | 1992-02-19 |
| 404121 | 1960-09-25 | Domenico | Birnbaum | M | 1993-08-01 |
| 404266 | 1960-09-25 | Quingbo | Jervis | F | 1985-03-15 |
| 409133 | 1960-09-25 | Nitsan | Kleiser | F | 1985-05-18 |
| 409558 | 1960-09-25 | Shunichi | Hofting | F | 1992-07-06 |
| 412045 | 1960-09-25 | Kristin | Bolotov | F | 1985-06-28 |
| 481404 | 1960-09-25 | Sanjeeva | Eterovic | F | 1986-06-05 |
| 483269 | 1960-09-25 | Mitchel | Pramanik | F | 1997-07-23 |
+--------+------------+------------+-----------+--------+------------+
10 rows in set (0.10 sec)
mysql> explain select * from employees inner join (select emp_no from employees order by birth_date limit 100000,10) as table_temp using (emp_no);
+----+-------------+------------+------------+--------+---------------+---------+---------+-------------------+--------+----------+----------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+------------+------------+--------+---------------+---------+---------+-------------------+--------+----------+----------------+
| 1 | PRIMARY | <derived2> | NULL | ALL | NULL | NULL | NULL | NULL | 100010 | 100.00 | NULL |
| 1 | PRIMARY | employees | NULL | eq_ref | PRIMARY | PRIMARY | 4 | table_temp.emp_no | 1 | 100.00 | NULL |
| 2 | DERIVED | employees | NULL | ALL | NULL | NULL | NULL | NULL | 299468 | 100.00 | Using filesort |
+----+-------------+------------+------------+--------+---------------+---------+---------+-------------------+--------+----------+----------------+
3 rows in set, 1 warning (0.00 sec)
可见效率提高了一倍,在explain中
第三行的select_type为DERIVED,是指这行是包含在from子句中的查询,我们可以看到,子句查询也没有使用索引
<derived2>
是指,第一行的查询说明表示当前查询依赖 id=N 的查询,此处N=2,那我们先看第二行:第二行type为
eq_ref
是指primary key 或 unique key 索引被连接(join)使用,,对于每个索引键的关联查询,返回匹配唯一行数据(有且只有1个)。在这里就是说在子查询查询到emp_no后,子查询中产生的临时表与employees表进行连接。(对于这里的explain的解释只包含了对explain各项参数的解释,但似乎没有办法直接验证优化思路,还望各位看官前辈指点)
为排序字段加上索引
既然我们在内连接中是通过排序字段birth_date
后对emp_no
进行查询,那么我们或许能再为排序字段加上索引以再次提高效率。
mysql> alter table employees add index birthdate_index (birth_date);
Query OK, 0 rows affected (0.75 sec)
Records: 0 Duplicates: 0 Warnings: 0
mysql> desc employees;
+------------+---------------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+------------+---------------+------+-----+---------+-------+
| emp_no | int(11) | NO | PRI | NULL | |
| birth_date | date | NO | MUL | NULL | |
| first_name | varchar(14) | NO | | NULL | |
| last_name | varchar(16) | NO | | NULL | |
| gender | enum('M','F') | NO | | NULL | |
| hire_date | date | NO | | NULL | |
+------------+---------------+------+-----+---------+-------+
6 rows in set (0.00 sec)
然后我们再次执行未优化和通过内连接优化的两条查询语句。
mysql> select * from employees order by birth_date limit 200000,10;
+--------+------------+------------+------------+--------+------------+
| emp_no | birth_date | first_name | last_name | gender | hire_date |
+--------+------------+------------+------------+--------+------------+
| 498507 | 1960-09-24 | Perla | Delgrange | M | 1989-12-08 |
| 494212 | 1960-09-25 | Susuma | Baranowski | M | 1989-05-15 |
| 496888 | 1960-09-25 | Rosalyn | Rebaine | M | 1985-11-27 |
| 497766 | 1960-09-25 | Matt | Atrawala | F | 1987-02-11 |
| 481404 | 1960-09-25 | Sanjeeva | Eterovic | F | 1986-06-05 |
| 483269 | 1960-09-25 | Mitchel | Pramanik | F | 1997-07-23 |
| 483270 | 1960-09-25 | Geoff | Gulik | F | 1993-11-25 |
| 59683 | 1960-09-25 | Supot | Millington | F | 1991-06-03 |
| 101264 | 1960-09-25 | Mansur | Atchley | F | 1990-05-22 |
| 92453 | 1960-09-25 | Khalid | Trystram | M | 1993-11-10 |
+--------+------------+------------+------------+--------+------------+
10 rows in set (0.20 sec)
mysql> select * from employees inner join (select emp_no from employees order by birth_date limit 200000,10) as temp_table using (emp_no);
+--------+------------+------------+------------+--------+------------+
| emp_no | birth_date | first_name | last_name | gender | hire_date |
+--------+------------+------------+------------+--------+------------+
| 498507 | 1960-09-24 | Perla | Delgrange | M | 1989-12-08 |
| 23102 | 1960-09-25 | Hsiangchu | Harbusch | M | 1986-03-14 |
| 29961 | 1960-09-25 | Susumu | Munoz | F | 1989-12-31 |
| 32061 | 1960-09-25 | Dipankar | Buescher | M | 1992-10-24 |
| 36216 | 1960-09-25 | Xianlong | Rassart | F | 1987-09-05 |
| 37058 | 1960-09-25 | Khue | Osgood | M | 1991-11-04 |
| 38365 | 1960-09-25 | Sariel | Ramsak | M | 1993-02-26 |
| 39901 | 1960-09-25 | Jianhui | Ushiama | M | 1985-12-03 |
| 59683 | 1960-09-25 | Supot | Millington | F | 1991-06-03 |
| 63784 | 1960-09-25 | Rosita | Zyda | M | 1988-08-12 |
+--------+------------+------------+------------+--------+------------+
10 rows in set (0.03 sec)
我们可以看到,普通查询语句并没有得到效率上的提升,但是内连接的查询效率得到了很大的提升,花费时间从原来的0.1s缩减为0.03秒,也就是说,再次优化后的内连接差不多可以应对百万(甚至千万级,因为实际生产中所使用的硬件设施肯定会远远好与我现在的基础班ECS)级别的数据了。
对于加上 birthdate_index
索引后普通查询效率未提升的说明:
因为我们查询的是select *
,即使emp_no和birth_date上有索引,在查询其他列信息的时候,我们依然需要回表。因此即使加上索引后,我们的普通查询依然使用的是全表扫描。
小结
经过试验证明,内连接对于order by+双参数limit有一定效果,在合适的内连接子查询下,增加相应的索引,能够使性能进一步提升。从0.2到0.1在到0.03,当缩减一个数量级时,那都是很大的突破。(完结撒花~)
最后的补充
EXPLAIN不会告诉你关于触发器、存储过程的信息或用户自定义函数对查询的影响情况
EXPLAIN不考虑各种Cache
EXPLAIN不能显示MySQL在执行查询时所作的优化工作
部分统计信息是估算的,并非精确值
EXPALIN只能解释SELECT操作,其他操作要重写为SELECT后查看执行计划
MySQL实验 内连接优化order by+limit 以及添加索引再次改进的更多相关文章
- mysql的内连接,外连接(左外连接,右外连接)巩固
1:mysql的内连接: 内连接(inner join):显示左表以及右表符合连接条件的记录: select a.goods_id,a.goods_name,b.cate_name from tdb_ ...
- Mysql的内连接,外链接,交叉链接
内连接:只连接匹配的行 inner join select A.*,B.* from A,B where A.id = B.parent_id 外链接包括左外链接,右外链接,全外链接 左外链接:包含 ...
- 关于MySQL的内连接,外连接的总结
首先创建两个数据库表,用户表u,账户表a 先看一下数据库表: u表: a表: 1. 内连接. 关键字:inner join SQL语句: select u.*,a.ID as aid,a.mon ...
- MySQL的内连接,左连接,右连接,全连接
内连接(INNER JOIN)(典型的连接运算,使用像 = 或 <> 之类的比较运算符).包括相等连接和自然连接. 内连接使用比较运算符根据每个表共有的列的值匹配两个表中的 ...
- EXPLAIN sql优化方法(1) 添加索引
添加索引优化器更高效率地执行语句 假设我们有两个数据表t1和t2,每个有1000行,包含的值从1到1000.下面的查询查找出两个表中值相同的数据行: mysql> SELECT t1.i1, t ...
- MySQL实验 子查询优化双参数limit
MySQL实验 子查询优化双参数limit 没想到双参数limit还有优化的余地,为了亲眼见到,今天来亲自实验一下. 实验准备 使用MySQL官方的大数据库employees进行实验,导入该示例库 ...
- MySQL内连接,左(外)连接,右(外)连接
用两个表(a_table.b_table),关联字段a_table.a_id和b_table.b_id来演示一下MySQL的内连接.外连接( 左(外)连接.右(外)连接.全(外)连接). MySQL版 ...
- 图解MySQL 内连接、外连接
2.内连接(INNER JOIN)内连接(INNER JOIN):有两种,显式的和隐式的,返回连接表中符合连接条件和查询条件的数据行.(所谓的链接表就是数据库在做查询形成的中间表).例如:下面的语句3 ...
- MySQL内连接和外连接
INNER JOIN(内连接,或等值连接):获取两个表中字段匹配关系的记录. LEFT JOIN(左连接):获取左表所有记录,即使右表没有对应匹配的记录. RIGHT JOIN(右连接): 与 LEF ...
随机推荐
- Linux 递归acl权限和默认acl权限
递归acl权限 递归acl指给父目录设定acl时,所有的子文件和子目录都拥有相同的acl权限 setfacl -m u:boduo:rx -R /project/ 默认acl权限 默认acl权限的作用 ...
- (七)DVWA之SQL Injection--SQLMap测试(Low)
目录结构 一.测试需求分析 二.SQLMap利用SQL注入漏洞,获取数据库信息 1.判断是否存在注入点 2.获取DBMS中所有的数据库名称 3.获取Web应用当前连接的数据库 4.列出数据库中的所有用 ...
- 钻进 Linux 内核看个究竟
Linux 内核,这个经常听见,却不不知道它具体是干嘛的东西,是不是觉得非常神秘? Linux 内核看不见摸不着,而对于这类东西,我们经常无从下手.本文就以浅显易懂的语言,带你钻进 Linux 内核, ...
- css3图片防止变形
1.object-fit 由于图片原始大小都不一样,强行设定大小值会导致拉伸,如果不设定大小则参差不齐. 之前我们大多数用的 大多数都是利用background-size: cover 来避免对图片造 ...
- 上位机开发之西门子PLC-S7通信实践
写在前面: 就目前而言,在中国的工控市场上,西门子仍然占了很大的份额,因此对于上位机开发而言,经常会存在需要与西门子PLC进行通信的情况.然后对于西门子PLC来说,通信方式有很多,下面简单列举一下: ...
- TensorFlow开发者证书 中文手册
经过一个月的准备,终于通过了TensorFlow的开发者认证,由于官方的中文文档较少,为了方便大家了解这个考试,同时分享自己的备考经验,让大家少踩坑,我整理并制作了这个中文手册,请大家多多指正,有任何 ...
- uniapp 基于 flyio 的 http 请求封装
之前写请求都是用别人封装好的,直接 import request 完事,自己第一次写还是一头雾水,学习了一波搞清楚了些,可以写简单的封装了. 首先要搞清楚为什么封装请求,同其他的封装一样,我们把不同请 ...
- 调用webservice接口,报错:(十六进制值0x01)是无效的字符
#事故现场 调用webservice接口,报错:(十六进制值0x01)是无效的字符. 如图: 意思是webservice返回的信息中包含无效的字符,无法解析成xml: #分析 使用postman向we ...
- [每日一题2020.06.10]Codeforces Round #644 (Div. 3) ABCDEFG
花了5个多少小时总算把div3打通一次( 题目链接 problem A 题意 : 两个x*y的矩形不能重叠摆放, 要放进一个正方形正方形边长最小为多少 先求n = min(2x, 2y, x+y) 再 ...
- 附017.Kubernetes_v1.17.4 Dashboard部署
一 Kubernetes dashboard简介 1.1 Web UI简介 dashboard是基于Web的Kubernetes用户界面.可以使用dashboard将容器化应用程序部署到Kuberne ...