MySQL 分页查询优化——延迟关联优化

1. InnoDB表的索引的几个概念

2. 覆盖索引和回表

3. 分页查询

4. 延迟关联优化

写在前面

下面的介绍均是在选用MySQL数据库和Innodb引擎的基础开展。我们先来学习索引的几个概念，帮助我们理解延迟关联优化的加快分页查询速度的原因。

一、Innodb表的索引的几个概念

InnoDB表是基于聚簇索引建立的。

索引一般分为主键索引和普通索引（辅助索引），聚簇索引并不是主键索引这样的单独的索引类型，而是一种数据存储方式。通俗的来说，单独的索引是存储了索引信息的B+Tree，而聚簇索引是在同一个结构中保存了B+Tree和数据行，即通过主键索引B+Tree的结构建立数据文件（网上的说法是索引和数据存储在同一个文件中），因此聚簇索引是一种数据存储方式。

如果对于索引的概念不是很熟悉，建议去查阅相关资料学习，索引是一个很庞大的知识结构。

Innodb表以主键索引建立后缀名为.MYD表存储文件，普通索引亦以B+Tree实现，并保存在后缀名为.MYI的文件中，具体结构图如下所示：

在查询时选用主键索引和普通索引有什么不一样呢？

以下面语句为例：

·
select * from table where id = 5;（id为主键索引）检索过程如上图绿色箭头所示，直接在主索引树上根据主键检索

·
select * from table where name = "Gates"; （name为普通索引）检索过程如上图红色箭头所示，先根据普通索引检索普通索引树得到id为5，然后再拿得到的id到主索引树检索得到结果。在这个过程中，回到主键索引树搜索的过程，我们称为回表。

从这里可以看出，基于非主键索引的查询需要多扫描一棵索引树。因此，我们在应用中应该尽量使用主键查询。

解释完普通索引和主键索引的检索过程，让我们来看看什么是覆盖索引。

二、覆盖索引和回表。

什么是“覆盖索引”？

查询的列被所建的辅助索引所覆盖，无需回表。用大白话解释就是，要查的数据直接可以从索引树上就能取得，无需回表查找。

注意：不是所有类型的索引都可以成为覆盖索引。覆盖索引必须要存储索引的列，而哈希索引、空间索引和全文索引等都不存储索引列的值，所以MySQL只能使用B-Tree索引做覆盖索引

结合上图的例子：

·
select id from table where name = "Gates"; 即为一个覆盖索引。

三、分页查询使用场景

需求：查询最近 7 天的订单，并做分页。订单表数据量：3000W。

未经优化的SQL：

select * from t_trade_order

where create_time
between '2019-10-17' and '2019-10-25'

limit 1000000, 10;

根据explain输出的结果可知，这是一条慢查询，在业务环境中不允许出现这样的慢查询。

我们都知道在做分页时会用到Limit关键字去筛选所需数据，limit接受1个或者2个参数，接受两个参数时第一个参数表示偏移量，即从哪一行开始取数据，第二个参数表示要取的行数。
如果只有一个参数，相当于偏移量为0。当偏移量很大时，如limit
100000,10 取第100001-100010条记录，mysql会取出100010条记录然后将前100000条记录丢弃，这无疑是一种巨大的性能浪费。

终于转入正题了，那我们应该怎样优化呢？

四、延迟关联优化

《高性能MySQL》书中其实也讨论这个情况：

延迟关联优化：通过使用覆盖索引查询返回需要的主键，再根据主键关联原表获得需要的数据。

select * from
t_trade_order t

inner join (

select id from t_trade_order

where create_time between '2019-10-17'
and '2019-10-25'

limit 1000000, 10

) e

on t.id = e.id;

根据explain分析，查询时间仅为0.31，比普通的分页查询快了一个数量级。

想必大家会想知道，为什么延迟关联对比普通分页查询可以起到这样的优化效果呢？

这就涉及到上面所讲的覆盖索引和回表这两个重要概念了！

我们来看看这两条语句的执行流程就很清楚了。

优化前：

select * from t_trade_order

where create_time
between '2019-10-17' and '2019-10-25'

limit 1000000, 10;

（create_time建表时被设置为普通索引）

1.在create_time索引树上找到create_time=‘2019-10-17’的记录，取得其id。

2.再到主索引树查到对于id的记录

3.如数量小于10，更新时间，循环步骤1、2

4. 。。。

5.在create_time索引树取下一个值create_time='2019-10-25'，不满足条件，循环结束。

6.查询结果放弃前1000000行，返回10行

显然，普通的分页查询是逐一通过普通索引获得id然后回表查询，每次回表进行一次IO，造成相当大的性能浪费。

优化后

select * from
t_trade_order t

inner join (

select id from t_trade_order

where create_time between '2019-10-17' and
'2019-10-25'

limit 1000000, 10

) e

on t.id = e.id;

1.使用覆盖索引，select id
from t_trade_order where create_time between '2019-10-17' and '2019-10-25'
limit 1000000, 10，查询结果放弃前1000000行，返回10行，查询出符合查询范围的id

2、回表关联，根据获得的id关联主索引表，批量匹配得到结果。（只需回到主索引表一次）

由此可知，通过使用覆盖索引查询返回需要的主键，再根据这些主键关联原表获得需要的行，这可以减少MySQL回表的次数，也避免了MySQL直接在原表上扫描那些需要丢弃的行数（实则在普通索引树上扫描，速度快很多）。

文章写到这里，希望对大家理解延迟关联优化有些许帮助。

MySQL 分页查询优化——延迟关联优化的更多相关文章

mysql大量数据分页查询优化-延迟关联
所有的php初学者都应该知道,mysql的分页语句写法如下: 1 select * from a limit (page-1)*page_size,page_size 而当这语句分页到一定程度时,例如 ...
【MySQL】查询优化实例解析-延迟关联优化
[提出问题] 从数据表t通过分页查询的方式读取数据,读取时要根据a1排序.t有80万行记录,当OFFSET很大时,读取速度很慢.优化后查询速度提升很快. 下图是表的定义,一共有几十个字段,RowLen ...
mysql优化----大数据下的分页，延迟关联，索引与排序的关系，重复索引与冗余索引，索引碎片与维护
理想的索引,高效的索引建立考虑: :查询频繁度(哪几个字段经常查询就加上索引) :区分度要高 :索引长度要小 : 索引尽量能覆盖常用查询字段(如果把所有的列都加上索引,那么索引就会变得很大) : 索引 ...
mysql分页查询优化(索引延迟关联)
对于web后台报表导出是一种常见的功能点,实际对应服务后端即数据库的排序分页查询.如下示例为公司商户积分报表导出其中一个sql ,当大批量的导出请求进入时候,mysql的cpu急剧上升瞬间有拖垮库的风 ...
mysql 利用延迟关联优化查询（select * from your_table order by id desc limit 2000000,20）
其实在我们的工作中类似,select * from your_table order by id desc limit 2000000,20会经常遇见,比如在分页中就很常见. 如果我们的sql中出现这 ...
MySQL 分页查询优化
有时在处理偏移量非常大的分页时候查询时,例如LIMIT 1000,10这样的查询,这时MySQL需要查询1010条记录然后只返回最后10条,前面1000条记录都被抛弃,这样的代价非常高.要优化这种查询 ...
复盘MySQL分页查询优化方案
一.前言 MySQL分页查询作为Java面试的一道高频面试题,这里有必要实践一下,毕竟实践出真知. 很多同学在做测试时苦于没有海量数据,官方其实是有一套测试库的. 二.模拟数据这里模拟数据分2种情况 ...
MySQL分页查询的性能优化
MySQL limit分页查询的性能优化 Mysql的分页查询十分简单,但是当数据量大的时候一般的分页就吃不消了. 传统分页查询:SELECT c1,c2,cn… FROM table LIMIT n ...
MYSQL分页 limit 太慢优化
limit分页原理当我们翻到最后几页时,查询的sql通常是:select * from table where column=xxx order by xxx limit 1000000,20.查询 ...

随机推荐

elastic集群单节点停机维护
为了elastic时时提供服务,需要elastic至少状态维持在yellow状态.所有,维护时需要依次对elastic单个节点进行维护. 操作步骤如下: 1.停止elastic的自动分配功能 curl ...
接口测试返回数据为JSONP格式时如何处理
#需要被处理的jsonp数据 JSONP = "jsonpreturn({'c': 1, 'd': 2});" #处理方法 def jsonp_to_json(JSONP): JS ...
linux中将video转换成gif
我使用的机器是Linux mint 17,因为习惯了在linux中开发而有时候在写小demo的时候要带一些演示,虽然可以使用录屏也可以但是视屏演示这些小demo也不是特别的方便.之前一直在linux中 ...
vs code编码设置
在使用vs code(版本1.35.0)打开文件时,出现乱码问题,可通过如下方式设置: 1.针对单个文件点击右下角的编码按钮(图中为UTF-8),然后选择操作,通过编码重新打开(Reopen wit ...
python使用代理ip
python使用代理的方法有两种 1. #先创建代理ip对象 proxy_support = urllib.request.ProxyHandler({'https':'117.64.149.137: ...
使用.Htaccess文件实现301重定向常用的七种方法
使用.Htaccess文件实现301重定向常用的七种方法 301重定向对广大站长来说并不陌生,从网站建设到目录优化,避免不了对网站目录进行更改,在这种情况下用户的收藏夹里面和搜索引擎里面可能保存的 ...
Mybatis-Plus学习.,简化你的开发,提升开发效率.
Mybatis-Plus学习以及实践简介参考网址开发环境开始开发 - 配置pom.xml - Dao/Service/Entity - 基本方法 - 查询类 - 更新类分页插件 - pom. ...
springcloud -- sleuth+zipkin整合rabbitMQ详解
为什么使用RabbitMQ? 我们已经知道,zipkin的原理是服务之间的调用关系会通过HTTP方式上报到zipkin-server端,然后我们再通过zipkin-ui去调用查看追踪服务之间的调用链路 ...
springboot与docker整合
一.springboot与docker整合 a.创建Dockerfile FROM java MAINTAINER "Wing"<1561815137@qq.com> ...
Flutter中TabBarView切换状态保存
TabBarView 类似于Android中的viewPager,但是默认是没有实现切换分页状态保存的.估计是出于节约内存的原因吧. 发现这个问题的时候,搜索了一下全网.大致就两种解决方案,1是修改源 ...

MySQL 分页查询优化——延迟关联优化

MySQL 分页查询优化——延迟关联优化的更多相关文章

随机推荐

热门专题