这个大表走索引字段查询的 SQL 怎么就成全扫描了，我TM人傻了

今天收到运营同学的一个 SQL，有点复杂，尤其是这个 SQL explain 都很长时间执行不出来，于是我们后台团队帮忙解决这个 SQL 问题，却正好发现了一个隐藏很深的线上问题。

select

a.share_code,

a.generated_time,

a.share_user_id,

b.user_count,

b.order_count,

a.share_order_id,

b.rewarded_amount

from t_risk_share_code a,

(select count(distinct r.user_id) user_count,

count(distinct r.order_id) order_count,

s.rewarded_amount,

r.share_code

from t_order s,t_order_rel r

where r.order_id = s.id and r.type = 1 and r.share_code = '我刚刚分享的订单编码'

group by r.share_code) b

where a.share_code = b.share_code and a.type = 1

首先，我们发现，直接 EXPLAIN 这个 SQL 也很慢，也就是可能某些子查询被实际执行了导致。所以，第一步我们先将其中的子查询拆解出来，逐步分析，即：

select count(distinct r.user_id) user_count,

count(distinct r.order_id) order_count,

max(s.rewarded_amount),

r.share_code

from t_order s,t_order_rel r

where r.order_id = s.id and r.type = 1 and r.share_code = '我刚刚分享的订单编码'

group by r.share_code

EXPLAIN 这个 SQL，执行很快，我们发现结果是：

奇了怪了，怎么 t_order 这张表的扫描就成为全扫描了？这张表的索引是正常的呀，主键就是 id。

根据官方文档，可以知道有如下几个原因

表太小了，走索引不值当的。但我们这里这两张表都非常大，都是千万级别的数据。
对于 WHERE 或者 ON 的条件，没有合适的索引，这也不是我们这里的情况，两张表都针对 WHERE 和 ON 条件有合适的索引（这里查询条件虽然都放到了 WHERE 里面，但是后面的分析我们会知道这个 SQL 会被改成 JOIN ON + WHERE 去执行）。
使用索引列与常数值作比较， MYSQL 通过索引分析出这个覆盖了表中大部分的值，其实就是分析出命中的行最后回表拉取数据的时候，表的文件中大部分页都要被加载到内存中进行读取，这样的话与其说先将索引加载到内存中获取命中列，不如直接扫描整个表，反正最后也是差不多将表的文件中大部分页都加载到内存中。这种情况很显然，不走索引反而会更快。我们这个 SQL 中，t_order_rel 表实际上根据 where 条件只会返回几十条数据，t_order 与 t_order_rel 是 1 对多的关系，这里不会命中太多数据的。
这一列值的离散度（Cardinality）太低，离散度就是是不同值的个数除以行数，最大为 1。但是这个值对于 innoDB 引擎来说，并不是实时计算的，可能不准确（尤其是在这一列的值发生更新导致行在页中的位置发生变化的时候）.但是对于 distinct 或者主键列是不用计算的，就是 1。如果离散度太低，那么其实和第三种情况差不多，会命中过多的行数。这里我们要优化的 SQL 使用的是主键，所以不属于这种情况。

虽然以上都不是我们这里要讨论的情况，但是这里还是提一些我们为了避免出现全扫描的优化：

为了让 SQL 执行计划分析器更准确，针对第四种情况，我们对于某些表可能需要在业务闲时定期执行 ANALYZE TABLE，来确保分析器的统计数据的准确性。
由于考虑分库分表，以及有时候数据库 SQL 执行计划总是不完美还是会出现索引走错的情况，我们一般尽量在 OLTP 查询业务上加 force index 强制走一些索引。这在使用基于中间件的分库分表（例如 sharding-jdbc）或者原生分布式数据库（例如 TiDB）过程中，我们经常遇到的坑。
对于 MySQL，我们设置 --max-seeks-for-key = 10000（默认这个值非常大），这样其实就是限制了每次 SQL 执行计划分析器分析出来的走索引可能扫描的行数。其原理非常简单，参考源码：

sql_planner.cc

double find_cost_for_ref(const THD *thd, TABLE *table, unsigned keyno,

                         double num_rows, double worst_seeks) {

  //将分析出会扫描的行数与 max_seeks_for_key 作对比，取其中小的那个

  //也就是 SQL 分析器得出的结论中，走索引扫描的行数不会超过 max_seeks_for_key

  num_rows = std::min(num_rows, double(thd->variables.max_seeks_for_key));

  if (table->covering_keys.is_set(keyno)) {

    // We can use only index tree

    const Cost_estimate index_read_cost =

        table->file->index_scan_cost(keyno, 1, num_rows);

    return index_read_cost.total_cost();

  } else if (keyno == table->s->primary_key &&

             table->file->primary_key_is_clustered()) {

    const Cost_estimate table_read_cost =

        table->file->read_cost(keyno, 1, num_rows);

    return table_read_cost.total_cost();

  } else

    return min(table->cost_model()->page_read_cost(num_rows), worst_seeks);

}

这个不能设置太小，否则会出现可以走多个索引但是走到实际扫描行数最多的索引。

现在没办法了，EXPLAIN 已经不够我们分析出问题了，只能进一步求助 optimizer_trace 了。不直接用 optimizer_trace 的原因是，optimizer_trace 必须完整的执行 SQL 之后，才能获取到所有有用的信息。

## 打开 optimizer_trace

set session optimizer_trace="enabled=on";

## 执行 SQL

select .....

## 查询 trace 结果

SELECT trace FROM information_schema.OPTIMIZER_TRACE;

通过 trace 结果我们发现，实际执行的 SQL 是：

SELECT

	各种字段

FROM

	`t_order_rel` `r`

	JOIN `t_order` `s`

WHERE

	(

	( `r`.`order_id` = CONVERT ( `s`.`id` USING utf8mb4 ) )

	AND ( `r`.`type` = 1 )

	AND ( `r`.`share_code` = 'B2MTB6C' )

	)

我去，原来两个表的字段的编码是不一样的！导致 JOIN ON 的时候，套了一层编码转换 CONVERT ( s.idUSING utf8mb4 ) ).我们知道，字段外套一层函数这种条件匹配，是走不到索引的，例如：date(create_time) < "2021-8-1" 是不能走索引的，但是 create_time < "2021-8-1" 是可以的。不同类型之间列的比较，也走不到索引，因为 MySQL 会自动套上类型转换函数。这也是 MySQL 的语法糖经常带来的误用。

这个 t_order_rel 的默认编码和其他表不一样，由于某些字段使用了 emoji 表情，所以建表的时候整个表默认编码使用了 utf8mb4。而且这个表仅仅是记录使用，没有 OLTP 的业务，只有一些运营同学使用的 OLAP 场景。所以一直没有发现这个问题。

修改字段编码后，SQL 终于不是全扫描了。同时以后要注意：

数据库指定默认的编码，表不再指定默认编码，同时对于需要使用特殊编码的字段，针对字段指定编码
join，where 的时候，注意 compare 两边的类型是否一致，是否会导致不走索引

微信搜索“我的编程喵”关注公众号，每日一刷，轻松提升技术，斩获各种offer：

这个大表走索引字段查询的 SQL 怎么就成全扫描了，我TM人傻了的更多相关文章

spring-data-redis 上百万的 QPS 压力太大连接失败，我 TM 人傻了
大家好,我们最近业务量暴涨,导致我最近一直 TM 人傻了.前几天晚上,发现由于业务压力激增,某个核心微服务新扩容起来的几个实例,在不同程度上,出现了 Redis 连接失败的异常: org.spring ...
大表建立索引引发enq: TX - row lock contention等待
今天要给一张日志表(6000w数据)建立索引,导致生产系统行锁部分功能卡住 create index idx_tb_cid on tb_login_log(user_id); 开始执行后大概花费了20 ...
三张关联表，大表；单次查询耗时400s，有group by order by 如何优化
问题SQL: select p.person_id as personId, p.person_name as personName, p.native_place as nativePlace, c ...
MySQL8.0大表秒加字段，是真的吗？
前言: 很早就听说 MySQL8.0 支持快速加列,可以实现大表秒级加字段.笔者自己本地也有8.0环境,但一直未进行测试.本篇文章我们就一起来看下 MySQL8.0 快速加列到底要如何操作. 1.了解 ...
SQL查询表,表的所有字段名，SQL查询表,表的所有字段名
SQL查询表,表的所有字段名 2011-07-29 10:21:43| 分类: SQLServer | 标签:表 sql 字段 |举报 |字号订阅 SQL查询表,表的所有字段名 SQ ...
Oracle系列(三)：情景查询一 a表中有个fid字段，逗号分隔开来，b表中有id字段及其他信息，如何关联a表的fid和和b表的id字段查询
现在有两个表,表a中 DOC FID 1 a,b,c 2 a,c,d 表b中 ID KEY a A b B c C d D 怎么联合查询出 DOC FID KEY 1 a,b,c A,B,C 2 a, ...
oracle 11g在大表中添加字段及默认值--加速
今天遇到这个问题了.简单的增加语句,默认SQLPLUS执行,却会超时. 要增加客户端的TIMEOUT时间才可以解决.(感觉超过两三分钟,默认超时30秒) 另外, 也可以用两步操作(1,增加字段,2,修 ...
mysql中关于关联索引的问题——对a,b,c三个字段建立联合索引，那么查询时使用其中的2个作为查询条件，是否还会走索引？
情况描述:在MySQL的user表中,对a,b,c三个字段建立联合索引,那么查询时使用其中的2个作为查询条件,是否还会走索引? 根据查询字段的位置不同来决定,如查询a, a,b a,b, ...
详解MySQL大表优化方案( 转)
当MySQL单表记录数过大时,增删改查性能都会急剧下降,可以参考以下步骤来优化: 单表优化除非单表数据未来会一直不断上涨,否则不要一开始就考虑拆分,拆分会带来逻辑.部署.运维的各种复杂度,一般以整型 ...

随机推荐

MySQL—Dos命令操作数据库
MySQL 是一个关系型数据库,存在表的概念结构,数据库可以存放多张表,每个表可以存放多个字段,每个字段可以存放多个记录 Dos命令操作数据库 PhpStudy使用终端打开数据库第一次打开默认的密 ...
通过UnityWebRequest得到的纹理转精灵
private IEnumerator GetImage(string url, Image fileImage) { UnityWebRequest WebRequest = new UnityWe ...
【重学Java】可变参数
可变参数可变参数[应用] 可变参数介绍可变参数又称参数个数可变,用作方法的形参出现,那么方法参数个数就是可变的了方法的参数类型已经确定,个数不确定,我们可以使用可变参数可变参数定义格式修饰符 ...
SpringMVC（8）国际化
在SpringMVC(七)格式化显示中我们讲了数据的格式化显示,Spring在做格式化展示的时候已经做了国际化处理,那么如何将我们网站的其它内容(如菜单.标题等)做国际化处理呢?这就是本篇要将的内容- ...
SQL 查询并不是从 SELECT 开始的
原文地址:SQL queries don't start with SELECT 原文作者:Julia Evans(已授权) 译者 & 校正:HelloGitHub-小熊熊 & 卤蛋 ...
cron表达式详解（转）
Cron表达式是一个字符串,字符串以5或6个空格隔开,分为6或7个域,每一个域代表一个含义,Cron有如下两种语法格式: (1) Seconds Minutes Hours DayofMonth Mo ...
关于SOA和AOP
SOA:面向服务的架构(SOA)是一个组件模型,它将应用程序的不同功能单元(称为服务)通过这些服务之间定义良好的接口和契约联系起来.C/S端框架有WPF,服务端应用程序有WCF.asp.net web ...
「CF85E」 Guard Towers
「CF85E」 Guard Towers 模拟赛考了这题的加强版然后我因为初值问题直接炸飞题目大意: 给你二维平面上的 \(n\) 个整点,你需要将它们平均分成两组,使得每组内任意两点间的曼哈顿距 ...
python mysql类
import pymysql class MysqlHelper(object): conn = None def __init__(self, host, username, password, d ...
[刘阳Java]_easyui-draggable拖动组件_第4讲
easyui-draggable的拖动组件还是比较好用的,它能够快速地实现网页中元素的拖动效果实现easyui-draggable拖动组件有两种方式:纯HTML方式和JS方式纯HTML方式实现拖动 ...

这个大表走索引字段查询的 SQL 怎么就成全扫描了，我TM人傻了

这个大表走索引字段查询的 SQL 怎么就成全扫描了，我TM人傻了的更多相关文章

随机推荐

热门专题