MySQL索引失效之隐式转换

常见索引失效：

1. 条件索引字段"不干净"：函数操作、运算操作

2. 隐式类型转换：字符串转数值；其他类型转换

3. 隐式字符编码转换：按字符编码数据长度大的方向转换，避免数据截取

一、常见索引失效场景

root@test 10:50 > show create table t_num\G

*************************** 1. row ***************************

       Table: t_num

Create Table: CREATE TABLE `t_num` (

  `id` int(11) NOT NULL AUTO_INCREMENT,

  `c1` int(11) NOT NULL,

  `c2` varchar(11) NOT NULL,

  PRIMARY KEY (`id`),

  KEY `ix_c1` (`c1`)

) ENGINE=InnoDB AUTO_INCREMENT=6 DEFAULT CHARSET=utf8mb4



root@test 10:51 > select * from t_num;

+----+----+----+

| id | c1 | c2 |

+----+----+----+

|  1 | -2 | -2 |

|  2 | -1 | -1 |

|  3 |  0 |  0 |

|  4 |  1 |  1 |

|  5 |  2 |  2 |

+----+----+----+



# 在c1字段上加上索引

root@test 10:52 > alter table t_num add index ix_c1(c1);



# 标准使用情况下，索引有效

root@test 10:55 > explain select * from t_num where c1 = -1;

+----+-------------+-------+------------+------+---------------+-------+---------+-------+------+----------+-------+

| id | select_type | table | partitions | type | possible_keys | key   | key_len | ref   | rows | filtered | Extra |

+----+-------------+-------+------------+------+---------------+-------+---------+-------+------+----------+-------+

|  1 | SIMPLE      | t_num | NULL       | ref  | ix_c1         | ix_c1 | 4       | const |    1 |   100.00 | NULL  |

+----+-------------+-------+------------+------+---------------+-------+---------+-------+------+----------+-------+

1、条件字段函数操作

# 在where中c1上加上abs()绝对值函数，可以看到type=ALL，全表扫描，在Server层进行绝对值处理后进行比较

root@test 10:58 > explain select * from t_num where abs(c1) = 1;

+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+

| id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra       |

+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+

|  1 | SIMPLE      | t_num | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    5 |   100.00 | Using where |

+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+

如上，对索引字段做函数操作，即where条件列上不干净时，可能会破坏索引值的有序性（按照c1的值有序组织索引树），因此优化器就决定放弃走索引树搜索功能。

但是，条件字段函数操作下，也并非完全的走全表扫描，优化器并非完全的放弃该字段索引。

# 选择查询的数据，只有id和c1字段，可以看到type=index，使用到了ix_c1索引

root@test 10:59 > explain select id,c1 from t_num where abs(c1) = 1;

+----+-------------+-------+------------+-------+---------------+-------+---------+------+------+----------+--------------------------+

| id | select_type | table | partitions | type  | possible_keys | key   | key_len | ref  | rows | filtered | Extra                    |

+----+-------------+-------+------------+-------+---------------+-------+---------+------+------+----------+--------------------------+

|  1 | SIMPLE      | t_num | NULL       | index | NULL          | ix_c1 | 4       | NULL |    5 |   100.00 | Using where; Using index |

+----+-------------+-------+------------+-------+---------------+-------+---------+------+------+----------+--------------------------+

如上，由于ix_c1索引树是根节点c1和叶子节点id构造的，虽然因为c1上的函数操作导致放弃索引定位，但优化器可以选择遍历该索引树，使用覆盖索引（Using index），无需回表，将所需的id和c1数据返回Server层后进行后续的abs()和where过滤。

2、条件字段运算操作

# where条件里，对c1进行运算操作

root@test 11:03 > explain select * from t_num where c1 + 1 = 2;

+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+

| id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra       |

+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+

|  1 | SIMPLE      | t_num | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    5 |   100.00 | Using where |

+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+

如上，虽然“+1”的操作并没有破坏c1索引的有序性，但优化器仍然没有使用该索引快速定位。因此，等号左边，注意优化掉索引字段上的运算操作。

3、隐式类型转换

# 在c2字段上加上索引

root@test 12:30 > alter table t_num add index ix_c2(c2);



# 标准使用情况下（注：c2是varchar类型的），索引有效

root@test 12:30 > explain select * from t_num where c2 = "2";

+----+-------------+-------+------------+------+---------------+-------+---------+-------+------+----------+-------+

| id | select_type | table | partitions | type | possible_keys | key   | key_len | ref   | rows | filtered | Extra |

+----+-------------+-------+------------+------+---------------+-------+---------+-------+------+----------+-------+

|  1 | SIMPLE      | t_num | NULL       | ref  | ix_c2         | ix_c2 | 42      | const |    1 |   100.00 | NULL  |

+----+-------------+-------+------------+------+---------------+-------+---------+-------+------+----------+-------+



# 去掉等号右边值的引号，即字符串和数值进行比较，索引失效

root@test 12:30 > explain select * from t_num where c2 = 2;

+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+

| id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra       |

+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+

|  1 | SIMPLE      | t_num | NULL       | ALL  | ix_c2         | NULL | NULL    | NULL |    5 |    20.00 | Using where |

+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+

如上，c2字段是varchar类型，是字符串和数值的比较，此时，MySQL是将字符串转换成数字，即此处的c2被CAST(c2 AS signed int)，这就相当于对条件字段做了函数操作，优化器放弃走树索引定位。

4、隐式字符编码转换

# 创建一个t_cou表，表结构基本和前面的t_num相同，唯一不同的设置是表字符集CHARSET=utf8

root@test 14:02 > show create table t_cou\G

*************************** 1. row ***************************

       Table: t_cou

Create Table: CREATE TABLE `t_cou` (

  `id` int(11) NOT NULL AUTO_INCREMENT,

  `c1` int(11) NOT NULL,

  `c2` varchar(10) NOT NULL,

  PRIMARY KEY (`id`),

  KEY `ix_c1` (`c1`),

  KEY `ix_c2` (`c2`)

) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8



root@test 14:02 > insert into t_cou select * from t_num;



# join表，t_num和t_cou通过c2字段进行关联查询

root@test 14:03 > select n.* from t_num n

    -> join t_cou c

    -> on n.c2 = c.c2

    -> where n.c1 = 1;

+----+----+----+

| id | c1 | c2 |

+----+----+----+

|  4 |  1 | 1  |

+----+----+----+



root@test 14:23 > explain select n.* from t_num n join t_cou c  on n.c2 = c.c2 where c.c1 = 1;

+----+-------------+-------+------------+------+---------------+-------+---------+-------+------+----------+-----------------------+

| id | select_type | table | partitions | type | possible_keys | key   | key_len | ref   | rows | filtered | Extra                 |

+----+-------------+-------+------------+------+---------------+-------+---------+-------+------+----------+-----------------------+

|  1 | SIMPLE      | c     | NULL       | ref  | ix_c1         | ix_c1 | 4       | const |    1 |   100.00 | NULL                  |

|  1 | SIMPLE      | n     | NULL       | ref  | ix_c2         | ix_c2 | 42      | func  |    1 |   100.00 | Using index condition |

+----+-------------+-------+------------+------+---------------+-------+---------+-------+------+----------+-----------------------+

# 执行计划分析:

# 1.操作的c表，使用了ix_c1定位到一行数据

# 2.从c表定位到的行数据，拿到c2字段去操作n表，t_cou称为驱动表，t_num称为被驱动表

# 3.ref=func说明使用了函数操作，指的是n.c2=CONVERT(c.c2 USING utf8mb4)

# 4.同时Using index condition，ix_c2读取查询时，使用被下推的条件过滤，满足条件的才回表



root@test 14:23 > explain select n.* from t_num n join t_cou c  on n.c2 = c.c2 where n.c1 = 1;

+----+-------------+-------+------------+-------+---------------+-------+---------+-------+------+----------+-----------------------------------------------------------------+

| id | select_type | table | partitions | type  | possible_keys | key   | key_len | ref   | rows | filtered | Extra                                                           |

+----+-------------+-------+------------+-------+---------------+-------+---------+-------+------+----------+-----------------------------------------------------------------+

|  1 | SIMPLE      | n     | NULL       | ref   | ix_c1,ix_c2   | ix_c1 | 4       | const |    1 |   100.00 | NULL                                                            |

|  1 | SIMPLE      | c     | NULL       | index | NULL          | ix_c2 | 32      | NULL  |    5 |   100.00 | Using where; Using index; Using join buffer (Block Nested Loop) |

+----+-------------+-------+------------+-------+---------------+-------+---------+-------+------+----------+-----------------------------------------------------------------+

# 执行计划分析:

# 1.操作的n表，使用了ix_c1定位到一行数据

# 2.从n表定位到的行数据，拿到c2字段去操作c表，t_num称为驱动表，t_cou称为被驱动表

# 3.同样的n.c2=c.c2，会将c.c2的字符集进行转换，即被驱动表的索引字段上加函数操作，索引失效

# 4.BNL，表join时，驱动表数据读入join buffer，被驱动表连接字段无索引则全表扫，每取一行和join buffer数据对比判断，作为结果集返回

如上，分别对t_num、 t_cou作为驱动表和被驱动表的执行计划分析，总结：

utf8mb4和utf8两种不同字符集（编码）类型的字符串在做比较时，MySQL会先把 utf8 字符串转成 utf8mb4 字符集，再做比较。为什么？字符集 utf8mb4 是 utf8 的超集，再做隐式自动类型转换时，为了避免数据在转换过程中由于截断导致数据错误，会“按数据长度增加的方向”进行转换。
表连接过程中，被驱动表的索引字段上加函数操作，会导致对被驱动表做全表扫描。

优化手法：

修改统一join字段的字符集
对驱动表下手，将连接字段的字符集转换成被驱动表连接字段的字符集

root@test 18:09 > explain select n.* from t_num n join t_cou c  on convert(n.c2 using utf8) = c.c2 where n.c1 = 1;

+----+-------------+-------+------------+------+---------------+-------+---------+-------+------+----------+--------------------------+

| id | select_type | table | partitions | type | possible_keys | key   | key_len | ref   | rows | filtered | Extra                    |

+----+-------------+-------+------------+------+---------------+-------+---------+-------+------+----------+--------------------------+

|  1 | SIMPLE      | n     | NULL       | ref  | ix_c1         | ix_c1 | 4       | const |    1 |   100.00 | NULL                     |

|  1 | SIMPLE      | c     | NULL       | ref  | ix_c2         | ix_c2 | 32      | func  |    1 |   100.00 | Using where; Using index |

+----+-------------+-------+------------+------+---------------+-------+---------+-------+------+----------+--------------------------+

二、类型转换

1、字符串转整型

# 字符开头的一律为0

root@test 18:44 > select convert("abc", unsigned integer);

+----------------------------------+

| convert("abc", unsigned integer) |

+----------------------------------+

|                                0 |

+----------------------------------+

# 'abc' = 0是成立的，因此查询时等号右边使用对应的类型很重要，0匹配出字段字符开头数据，'0'只匹配0

root@test 18:44 > select 'abc' = 0;

+-----------+

| 'abc' = 0 |

+-----------+

|         1 |

+-----------+



# 数字开头的，直接截取到第一个不是字符的位置

root@test 18:45 > select convert("123abc", unsigned integer);

+-------------------------------------+

| convert("123abc", unsigned integer) |

+-------------------------------------+

|                                 123 |

+-------------------------------------+

2、时间类型转换

root@test 19:11 > show create table time_demo\G

*************************** 1. row ***************************

       Table: time_demo

Create Table: CREATE TABLE `time_demo` (

  `id` int(11) NOT NULL AUTO_INCREMENT,

  `c1` datetime DEFAULT NULL,

  `c2` date DEFAULT NULL,

  PRIMARY KEY (`id`),

  KEY `ix_c1` (`c1`)

) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8mb4



root@test 19:15 > select count(*) from time_demo;

+----------+

| count(*) |

+----------+

|       11 |

+----------+



root@test 19:16 > select * from time_demo limit 4;

+----+---------------------+------------+

| id | c1                  | c2         |

+----+---------------------+------------+

|  1 | 2022-01-08 00:01:01 | 2022-01-08 |

|  2 | 2022-01-06 23:01:01 | 2022-01-06 |

|  3 | 2022-01-06 00:00:00 | 2022-01-06 |

|  4 | 2022-01-08 00:00:00 | 2022-01-08 |

+----+---------------------+------------+



# 1.date转datetime：末尾追加 00:00:00

root@test 19:11 > select * from time_demo where c1 between "2022-01-06" and "2022-01-08";

+----+---------------------+------------+

| id | c1                  | c2         |

+----+---------------------+------------+

|  2 | 2022-01-06 23:01:01 | 2022-01-06 |

|  3 | 2022-01-06 00:00:00 | 2022-01-06 |

|  4 | 2022-01-08 00:00:00 | 2022-01-08 |

+----+---------------------+------------+

# 结果分析：c1是datetime类型，进行比较时，between and中的date类型会转换成datetime

# 即 where c1 between "2022-01-06 00:00:00" and "2022-01-08 00:00:00";

# 同 where c1 >= "2022-01-06 00:00:00" and c1 <= "2022-01-08 00:00:00";

root@test 19:42 > explain select * from time_demo where c1 between "2022-01-06" and "2022-01-08";

+----+-------------+-----------+------------+-------+---------------+-------+---------+------+------+----------+-----------------------+

| id | select_type | table     | partitions | type  | possible_keys | key   | key_len | ref  | rows | filtered | Extra                 |

+----+-------------+-----------+------------+-------+---------------+-------+---------+------+------+----------+-----------------------+

|  1 | SIMPLE      | time_demo | NULL       | range | ix_c1         | ix_c1 | 6       | NULL |    3 |   100.00 | Using index condition |

+----+-------------+-----------+------------+-------+---------------+-------+---------+------+------+----------+-----------------------+

# 格式化date转datetime

root@test 19:23 > select date_format("2022-01-08","%Y-%m-%d %H:%i:%s");

+-----------------------------------------------+

| date_format("2022-01-08","%Y-%m-%d %H:%i:%s") |

+-----------------------------------------------+

| 2022-01-06 00:00:00                           |

+-----------------------------------------------+



# 2.datetime转date：直接截取date部分

root@test 19:47 > select date(c1) from time_demo limit 1;

+------------+

| date(c1)   |

+------------+

| 2022-01-06 |

+------------+



# 3.date转time，没有意义，直接变成 00:00:00

MySQL索引失效之隐式转换的更多相关文章

面试题： MySQL 索引失效的10大原因
个人博客网:https://wushaopei.github.io/ (你想要这里多有) 1.建表: CREATE TABLE staffs ( id INT PRIMARY KEY AUTO_ ...
数栈SQL优化案例：隐式转换
MySQL是当下最流行的关系型数据库之一,互联网高速发展的今天,MySQL数据库在电商.金融等诸多行业的生产系统中被广泛使用. 在实际的开发运维过程中,想必大家也常常会碰到慢SQL的困扰.一条性能不好 ...
MySQL性能优化：MySQL中的隐式转换造成的索引失效
数据库优化是一个任重而道远的任务,想要做优化必须深入理解数据库的各种特性.在开发过程中我们经常会遇到一些原因很简单但造成的后果却很严重的疑难杂症,这类问题往往还不容易定位,排查费时费力最后发现是一个很 ...
MySQL SQL优化之字符串索引隐式转换
之前有用户很不解:SQL语句非常简单,就是select * from test_1 where user_id=1 这种类型,而且user_id上已经建立索引了,怎么还是查询很慢? test_1的表结 ...
一个 MySQL 隐式转换的坑，差点把服务器整崩溃了
我是风筝,公众号「古时的风筝」,专注于 Java技术及周边生态. 文章会收录在 JavaNewBee 中,更有 Java 后端知识图谱,从小白到大牛要走的路都在里面. 本来是一个平静而美好的下午,其 ...
mysql中的隐式转换
在mysql查询中,当查询条件左右两侧类型不匹配的时候会发生隐式转换,可能导致查询无法使用索引.下面分析两种隐式转换的情况看表结构 phone为 int类型,name为 varchar EXPLAI ...
MySQL隐式转换的坑
MySQL以以下规则描述比较操作如何进行转换: 两个参数至少有一个是 NULL 时,比较的结果也是 NULL,例外是使用 <=> 对两个 NULL 做比较时会返回 1,这两种情况都不需要做 ...
关于MySQL隐式转换
一.如果表定义的是varchar字段,传入的是数字,则会发生隐式转换. 1.表DDL 2.传int的sql 3.传字符串的sql 仔细看下表结构,rid的字段类型: 而用户传入的是int,这里会有一个 ...
【索引失效】什么情况下会引起MySQL索引失效
索引并不是时时都会生效的,比如以下几种情况,将导致索引失效: 1.如果条件中有or,即使其中有条件带索引也不会使用(这也是为什么尽量少用or的原因) 注意:要想使用or,又想让索引生效,只能将or条件 ...

随机推荐

Java oop 笔记
摘要网址:http://note.youdao.com/noteshare?id=bbdc0b970721e40d327db983a2f96371
关于python中显存回收的问题
技术背景笔者在执行一个Jax的任务中,又发现了一个奇怪的问题,就是明明只分配了很小的矩阵空间,但是在多次的任务执行之后,显存突然就爆了.而且此时已经按照Jax的官方说明配置了XLA_PYTHON_C ...
[BUUCTF]REVERSE——reverse3
reverse3 附件步骤: 例行查壳儿,32位程序,无壳儿 32位ida载入,shift+f12检索程序里的字符串,得到了有关flag的提示,而且看到了ABCDE--78这种字符串,猜测存在bas ...
Table.CombineColumns合并…Combine…（Power Query 之 M 语言）
数据源: 任意表,表中列数超过两列目标: 其中两列合并为一列操作过程: 选取两列>[转换]>[合并列]>选取或输入分隔符>输入新列名>[确定] M公式: = T ...
Tornado WEB服务器框架 Epoll-- 【Mysql数据库】
5.1 数据库与Django框架相比,Tornado没有自带ORM,对于数据库需要自己去适配.我们使用MySQL数据库. 在Tornado3.0版本以前提供tornado.database模块用来操 ...
Uni-app原生插件入门使用教程-[1]从Uni-app插件市场试用插件
[1]从Uniapp插件市场试用插件当HBuilderX中提供的能力无法满足App功能需求,需要通过使用Andorid/iOS原生开发实现时,可使用App离线SDK开发原生插件来扩展原生能力. 如使 ...
jquery gantt 的使用
1.引入css与js文件 <link rel="stylesheet" href="css/style.css" /> <script src ...
【LeetCode】1160. Find Words That Can Be Formed by Characters 解题报告(C++)
作者: 负雪明烛 id: fuxuemingzhu 个人博客:http://fuxuemingzhu.cn/ 目录题目描述题目大意解题方法字典统计日期题目地址:https://leetco ...
【LeetCode】449. Serialize and Deserialize BST 解题报告（Python）
[LeetCode]449. Serialize and Deserialize BST 解题报告(Python) 标签: LeetCode 题目地址:https://leetcode.com/pro ...
The Balance(poj2142)
The Balance Time Limit: 5000MS Memory Limit: 65536K Total Submissions: 5452 Accepted: 2380 Descr ...