3、MySQL 索引失效的场景

索引失效的场景：

1、没有 where 条件

直接看 SQL 语句

2、where 条件中所在的列没有建立索引

show index from t;

3、从表中取得数据超过某个阈值。通常认为是 20~30%，即使 where 条件和索引都满足，也不会走索引

看表的行数、看下索引列的 cardinality 值，card 值只能直观反映 = 操作符返回的行数。

对于>=、<=、like、between and 的情况，card 值不能直观判断返回值的数据量。

有时候可以尝试着执行一下，但要注意，不是执行真正的 SQL，而是主要是为了得到 where 访问条件返回的行数，所以可以使用下面的技巧实现需求的转换：

select  x.c_id,s.s_name from xuanke x join student s on x.stu_id=s.stu_id  where s.s_name like ‘abc%’; ——————>

select count() from student where s_name like ‘abc%’;

上面的 sql 是不是原始 SQL，而是你想得到某个结果而自己写的 SQL。

4、多列索引没有使用前导列

show index from t1;

5、索引本身失效

如何查找失效索引？

如果索引失效，重建索引！

MySQL 中目前没法查看索引的状态信息。

Use information_schema，show tables，有 innodb_sys_indexs 系统所有的索引信息，

但索引状态信息实际没法看，show index from 语法其实访问的是

information_schema.STATISTICS 数据字典。

6、where 条件列上不干净

比如在列上有函数：MySQL 中不支持，Oracle 中支持在列上建立函数索引

select ... from t1 where upper(name) like 'ABC%';

比如在 where 条件中存在运算：

select ... from t1 where id-<;

7、小表也尽量走索引，由于 gap 锁的存在

select 尽量走索引，对于 dml 一定要走索引（否则就是全表锁，导致业务串行化）

8、使用了 ignore index hints

使用了 hints，强制忽略了某个索引，导致没走索引

9、统计信息不真实(严重不真实)

统计信息可能会出现严重不真实导致不走索引：表中有  万，索引唯一值有  万，但是旧统计信息中唯一值的数量才 ，导致不走索引，走全表扫描。

如何判断统计信息是否真实：

show table status like 't1';

show index from t1;

手工收集统计信息：

analyze table t1;

例如

对一个表做了 truncate 以后，系统在随后的时间里面，启动了一个自动收集统计信息的作业，这个表的行数更新变成  行。随后，对这个表进行数据的

导入，导入  万行，这时候 MySQL 不会去看表中真实的行数，还是会看统计信息的  行，这时候会出现问题，需要手工收集统计信息。

但是对于递增式的、每日规律变化的情况，统计信息没有必要每日收集。

对于统计信息的收集：

学会使用 UE、notepad++等工具批量手工收集统计信息：

Analyze table table_name；

利用 select concat(‘analyze table ',TABLE_NAME,';') from tables where table_schema=’tpcc1000’;

复制所有的表，利用 UE 编辑器的列编辑模式，直接去掉不必要的列，加上 analyze table 和分号变成语句，直接在 MySQL 里执行就好了。

举例：

MySQL> select concat('analyze table ',TABLE_NAME,';') from information_schema.tables where table_schema='TENNIS';

+-----------------------------------------+

| concat('analyze table ',TABLE_NAME,';') |

+-----------------------------------------+

| analyze table COMMITTEE_MEMBERS; |

| analyze table MATCHES; |

| analyze table PENALTIES; |

| analyze table PLAYERS; |

| analyze table TEAMS; |

在 ultraedit 里使用列模式，直接编辑，编辑完直接复制粘贴到 MySQL 里执行就行。

analynize table COMMITTEE_MEMBERS ;

analynize table MATCHES ;

analynize table PENALTIES ;

analynize table PLAYERS ;

analynize table TEAMS ;

MySQL 自动收集统计信息的参数：

比如在 show table status like ‘customer’；的时候会自动收集，最好是手工收集。

、自动存储参数：innodb_stats_persistent

、变化量大的情况下，自动收集参数：innodb_stats_auto_recalc：

MySQL> show variables like '%stat%';

| innodb_stats_sample_pages |  —

—不管你访问多少，每次都是随机扫  个页，看看里面有多少行。

| innodb_stats_persistent_sample_pages |  ——

analyze 是采样  个页，一般可以设置成  个页，所以 analyze 准确一些，建议定期手工收集一下。

| innodb_stats_persistent | ON ——

收集完统计信息以后，把收集的信息永久保存到数据字典里面去，数据库重新启动的时候这个统计信息还在，还可以继续使用，如果是 off，存到内存里面去，下次启动就没了，所以这个参数一定要是 on。

| innodb_stats_auto_recalc | ON —

—当 update 或 delete 等操作产生大的影响时，如果这个参数是 on，会触发统计信息的自动收集。例如：变化超过 %就触发自动收集，有时候会关闭。

统计信息：

、表的行数

、索引列的唯一值的数量

关于统计信息需要知道：

、只有在统计的时候，才会更新对应的数据

、统计信息使用来生成执行计划的

、统计信息没有必要和表、索引保持实时更新

比如：一个表行数是  万，索引列唯一值的数量是  万，走索引效果很好；如果这个表的行数变成了  万，索引列唯一值的数量变成了 40万，不影响走索引的效果，所以一般在对表做 dml 时不会主动更新统计信息，因为这样会加重系统的负担。

、统计信息总是近似的反应表和索引的信息

如何手工修改表的行数以及 cardinality 值：为了欺骗 MySQL 是否走索引

需要注意：在执行 show table status like 语句时会自动收集统计信息。

、根据 mysql.innodb_table_stats 数据字典修改 n_rows 值：

[root@localhost][mysql]> select * from mysql.innodb_table_stats limit ;

+---------------+-------------------+---------------------+--------+----------------------+--------------------------+

| database_name | table_name        | last_update         | n_rows |clustered_index_size  | sum_of_other_index_sizes |

+---------------+-------------------+---------------------+--------+----------------------+--------------------------+

| TENNIS        | COMMITTEE_MEMBERS | -- :: |      |                     |                         |

+---------------+-------------------+---------------------+--------+----------------------+--------------------------+

 row in set (0.00 sec)

[root@localhost][mysql]>

、根据 mysql.innodb_index_stats 数据字典修改 cardinality 值：

[root@localhost][tpcc1000]> select * from mysql.innodb_index_stats where database_name='tpcc1000' and table_name='customer' and stat_description='c_first';

+---------------+------------+------------+---------------------+--------------+------------+-------------+------------------+

| database_name | table_name | index_name | last_update         | stat_name    | stat_value | sample_size | stat_description |

+---------------+------------+------------+---------------------+--------------+------------+-------------+------------------+

| tpcc1000      | customer   | id_first   | -- :: | n_diff_pfx01 |      |           | c_first |

+---------------+------------+------------+---------------------+--------------+------------+-------------+------------------+

 row in set (0.00 sec)

[root@localhost][tpcc1000]> update mysql.innodb_index_stats set stat_value= where database_name='tpcc1000' and table_name='customer' and stat_description='c_first';

Query OK,  row affected (0.01 sec)

Rows matched:  Changed:  Warnings: 

[root@localhost][tpcc1000]> select * from mysql.innodb_index_stats where database_name='tpcc1000' and table_name='customer' and stat_description='c_first';

+---------------+------------+------------+---------------------+--------------+------------+-------------+------------------+

| database_name | table_name | index_name | last_update         | stat_name    | stat_value | sample_size | stat_description |

+---------------+------------+------------+---------------------+--------------+------------+-------------+------------------+

| tpcc1000      | customer   | id_first   | -- :: | n_diff_pfx01 |          |           | c_first          |

+---------------+------------+------------+---------------------+--------------+------------+-------------+------------------+

 row in set (0.01 sec)

[root@localhost][tpcc1000]>

mysql> select * from xuanke where c_id >;

Empty set (0.31 sec)

mysql> explain select * from xuanke where c_id >;

+----+-------------+--------+-------+-------------------+-------------------+---------+------+------+-----------------------+

| id | select_type | table  | type  | possible_keys     | key               |key_len  | ref  | rows | Extra |

+----+-------------+--------+-------+-------------------+-------------------+---------+------+------+-----------------------+

|   | SIMPLE      | xuanke | range | FK_Relationship_3 | FK_Relationship_3 |        | NULL |     | Using index condition |

+----+-------------+--------+-------+-------------------+-------------------+---------+------+------+-----------------------+

 row in set (0.00 sec)

mysql> explain select * from xuanke where c_id >;

+----+-------------+--------+------+-------------------+------+---------+------+--------+-------------+

| id | select_type | table | type  | possible_keys     | key  | key_len | ref  | rows   |Extra |

+----+-------------+--------+------+-------------------+------+---------+------+--------+-------------+

|   | SIMPLE      | xuanke | ALL  | FK_Relationship_3 | NULL | NULL    |NULL  |  | Using where |

+----+-------------+--------+------+-------------------+------+---------+------+--------+-------------+

 row in set (0.38 sec)

mysql>

10、数据倾斜的情况下

例如状态值的列，有可能出现没有走索引的情况：

select * from dingdan where dingdanzhuangtai='未处理';

如何解决行数据倾斜：

　　、使用手工修改统计信息，card 值提升一下

　　、使用 like 的时候，会临时性使用采样的方式，从表中取  个数据块，统计“未处理”值的数量，这时候反而准确了。

　　、使用 force index 和 ignore index 来做特殊处理，在 Oracle 中不会出现数据倾斜导致不走索引的情况，因为有数据值所占百分比，能够正确引导是否走索引。

11、CBO 计算走索引花费太大

根本原因还是从表中访问的行数过多

针对 like、<=、>=、between and 等不确定的一些条件，会进行动态采样，可能出现有时候走索引，有时候不走索引的情况。

数据库最核心的组件是优化器，对 SQL 进行解析，生成执行计划。

优化器工作模式：

 、RBO（rule based optimization），基于规则的优化器，条件太苛刻，现在基本不用

主要干什么：

　　、是否走索引（定义规则为：是否有 where 条件、where 条件是否有索引等，如果满足规则就走索引，不满足就不走索引）

　　、表的连接顺序等（定义规则为：按照写的 SQL 中的表连接顺序）针对这种优化器，我们在写 SQL 的时候，就需要了解这种优化器的工作习性（规则库），按照他的脾气来，强烈依赖 SQL 的写法。

、CBO（cost based optimization），基于成本的优化器（现在主要是 CBO，MySQL只有 CBO）

　　、在解析以前，会做一件事情，对 SQL 进行改写，改写成更合理的一些 SQL语句

　　、将执行路径列出来，计算每一个执行路径的成本(cpu 和 io 的成本，主要是 io 成本)，基于统计信息进行计算，估算一个成本

　　、选择执行成本最低的 SQL 作为执行计划

对于 CBO：

、不过度依赖 SQL 写法

、严重依赖统计信息

12、隐式类型转换导致索引失效

、数字列不害怕类型转换

、字符串列非常害怕隐式类型转换，因此对于字符串的列，一定要加上''：

字符串列“坑”

我们习惯于将很多列定位为字符串，例如手机号列，在 where 的时候，也习惯与=，不加''，因为我们认为这是数字，但是定义的是字符列，发生隐式转换，导致索引失效。

、日期列不害怕隐式类型转换

设计原则：

如果存储的是数字，就定义成数字列

如果存储的是日期，就定义成日期列

如果存储的是字符串，where 条件的时候，右面一定要加上''

13、<>会导致索引失效

因为数据库认为等于的时候会取少量数据，认为不等于会取大量的数据

14、在 where 条件的 like 中%在前

where like '%abc'，有索引也会失效，后面的中这种写法索引可能不会失效

select * from ... where name like 'abc%'

15、not in(值的列表)经常索引失效，in(值的列表)一般走索引

因为认为 not in 时结果集会比较大，而 in 的时候结果集会比较小。

16、对于 not in 和 not exists 子查询的情况，索引不一定失效

对 not in、not exists 和 left join 之间的相互转换，索引都生效了：

mysql> explain select * from student s where s.stu_id not in (select stu_id from xuanke);

+----+-------------+--------+-------+-------------------+-------------------+---------+------ +--------+-------------+

| id | select_type | table  | type  | possible_keys     | key |key_len      | ref     | rows  | Extra  |

+----+-------------+--------+-------+-------------------+-------------------+---------+------ +--------+-------------+

|   | PRIMARY     | s      | ALL   | NULL              | NULL              | NULL    | NULL  |  | Using where |

|   | SUBQUERY    | xuanke | index | FK_Relationship_1 |FK_Relationship_1  |        | NULL  |  | Using index |

+----+-------------+--------+-------+-------------------+-------------------+---------+------ +--------+-------------+

 rows in set (0.00 sec)

mysql> explain select * from student s where not exists (select  from xuanke x where x.stu_id=s.stu_id);

+----+--------------------+-------+------+-------------------+-------------------+---------+-----------------+--------+-------------+

| id | select_type        | table | type | possible_keys     | key| key_len      | ref     | rows            | Extra |

+----+--------------------+-------+------+-------------------+-------------------+---------+-----------------+--------+-------------+

|  | PRIMARY             | s     | ALL  | NULL              | NULL              | NULL    | NULL            |  | Using where |

|  | DEPENDENT SUBQUERY  | x     | ref  | FK_Relationship_1 |FK_Relationship_1  |        | xuanke.s.stu_id |       | Using index |

+----+--------------------+-------+------+-------------------+-------------------+---------+-----------------+--------+-------------+

mysql> explain select * from student s left join xuanke x on s.stu_id=x.stu_id and x.c_id is null;

+----+-------------+-------+------+-------------------------------------+-------------------+---------+-----------------+--------+-------------+

| id | select_type | table | type | possible_keys                       | key               | key_len | ref             | rows   | Extra |

+----+-------------+-------+------+-------------------------------------+-------------------+---------+-----------------+--------+-------------+

|   | SIMPLE      | s     | ALL  | NULL                                | NULL              | NULL    | NULL            |  | NULL|

|   | SIMPLE      | x     | ref  | FK_Relationship_1,FK_Relationship_3 |FK_Relationship_1  |        | xuanke.s.stu_id |       | Using where |

+----+-------------+-------+------+-------------------------------------+-------------------+---------+-----------------+--------+-------------+

 rows in set (0.00 sec)

17、对于 in、exists 子查询的情况，索引一般也不会失效

mysql> explain select * from student s where exists (select  from xuanke x

where x.stu_id=s.stu_id);

+----+--------------------+-------+------+-------------------+-------------------+---------+-----------------+--------+-------------+

| id | select_type        | table | type | possible_keys     | key               | key_len | ref             | rows   | Extra |

+----+--------------------+-------+------+-------------------+-------------------+---------+-----------------+--------+-------------+

|   | PRIMARY            | s     | ALL  | NULL              | NULL              | NULL    | NULL            |  | Using where |

|   | DEPENDENT SUBQUERY | x     | ref  | FK_Relationship_1 |FK_Relationship_1  |        | xuanke.s.stu_id |       | Using index |

+----+--------------------+-------+------+-------------------+-------------------+---------+-----------------+--------+-------------+

 rows in set (0.00 sec)

mysql> explain select * from student s where s.stu_id in (select stu_id from xuanke);

+----+--------------+-------------+--------+-------------------+-------------------+--------- +-----------------+--------+-------------+

| id | select_type  | table       | type   | possible_keys     | key               | key_len  | ref             | rows   | Extra       |

+----+--------------+-------------+--------+-------------------+-------------------+--------- +-----------------+--------+-------------+

|   | SIMPLE       | s           | ALL    | PRIMARY           |NULL               | NULL     | NULL            |  | Using where |

|   | SIMPLE       | <subquery2> | eq_ref | <auto_key>        |<auto_key>         |         | xuanke.s.stu_id |       | NULL        |

|   | MATERIALIZED | xuanke      | index  | FK_Relationship_1 |FK_Relationship_1  |         | NULL            |  | Using index |

+----+--------------+-------------+--------+-------------------+-------------------+--------- +-----------------+--------+-------------+

 rows in set (0.00 sec)

18、对于日期时间列来说，下面的索引会失效

发生了隐式类型转换，导致索引会失效：

explain select * from login_record1 where t_time=cast('2011-1-1' as date);

explain select * from login_record1 where d_date=cast('13:00:00' as time);

explain select * from login_record1 where t_time='2011-1-1'; //索引不会失效

19、is null 一般会走索引，即使所有的数据都为空，这是一个 bug

is not null 有时候走索引，有时候不走索引，还是比较准确，主要看空值和非空值的数量。

is null 可能会成为一个坑。

MySQL 没有存储数据分布，因此在进行 where 条件的时候，可能会出现数据倾斜的盲点，反而采用 like 等模糊匹配的时候，因为会刺激 mysql 进行动态采样，反而会比较准确。有时候会出现下面的一些写法：

　　、like 'abc';来代替='abc'

　　、between  and  来代替=

3、MySQL 索引失效的场景的更多相关文章

MySQL索引失效的场景
WHERE字句的查询条件里有不等于号(WHERE column!=-),MYSQL将无法使用索引类似地,如果WHERE字句的查询条件里使用了函数(如:WHERE DAY(column)=-),MYS ...
MySQL索引失效的几种场景
我们都知道建立索引能够提高查询效率,那么是不是任何情况下都能提高呢,当然不是的的,下面我们就来列举一些常见的索引失效的场景. 借用上一篇文章的dm_person_info表在card_code列没加 ...
MySQL索引失效的常见场景
当然请记住,explain是一个好习惯! MySQL索引失效的常见场景在验证下面的场景时,请准备足够多的数据量,因为数据量少时,MySQL的优化器有时会判定全表扫描无伤大雅,就不会命中索引了. 1. ...
面试突击60：什么情况会导致 MySQL 索引失效？
为了验证 MySQL 中哪些情况下会导致索引失效,我们可以借助 explain 执行计划来分析索引失效的具体场景. explain 使用如下,只需要在查询的 SQL 前面添加上 explain 关键字 ...
MySQL 索引失效-模糊查询，最左匹配原则，OR条件等。
索引失效介绍索引失效就是我们明明在查询时的条件为索引列(包括自己新建的索引),但是索引不能起效,走的是全表扫描.explain 后可查看type=ALL. 这是为什么呢? 首先介绍有以下几种情况索 ...
mysql索引总结(4)-MySQL索引失效的几种情况
mysql索引总结(1)-mysql 索引类型以及创建 mysql索引总结(2)-MySQL聚簇索引和非聚簇索引 mysql索引总结(3)-MySQL聚簇索引和非聚簇索引 mysql索引总结(4)-M ...
面试题： MySQL 索引失效的10大原因
个人博客网:https://wushaopei.github.io/ (你想要这里多有) 1.建表: CREATE TABLE staffs ( id INT PRIMARY KEY AUTO_ ...
Mysql 索引失效场景
例如:一张USER表有字段属性 name,age 其中name为索引下面列举几个索引失效的情况 1. select * from USER where name=‘xzz’ or age= ...
MySQL索引失效之隐式转换
常见索引失效: 1. 条件索引字段"不干净":函数操作.运算操作 2. 隐式类型转换:字符串转数值:其他类型转换 3. 隐式字符编码转换:按字符编码数据长度大的方向转换,避免数据截 ...

随机推荐

DOCKER学习_004:Docker网络
一简介当Docker进程启动时,会在主机上创建一个名为docker0的虚拟网桥,此主机上启动的docker容器会连接到这个虚拟网桥上.虚拟网桥的工作方式和物理交换机类似,这样主机上的所有容器就通过 ...
20行Python代码爬取王者荣耀全英雄皮肤
引言王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了.我们今天的重点是爬取王者荣耀所有英雄的所有皮肤,而且仅仅使用20行Python代码即可完成. 准备工作 ...
「洛谷P1402」酒店之王解题报告
P1402 酒店之王题目描述 XX酒店的老板想成为酒店之王,本着这种希望,第一步要将酒店变得人性化.由于很多来住店的旅客有自己喜好的房间色调.阳光等,也有自己所爱的菜,但是该酒店只有p间房间,一天只 ...
阿里云ECS服务器Ubuntu配置MySQL远程访问
root账户登录服务器Ubuntu16.04 apt-get update apt-get install mysql-server mysql-client; 安装时会让你设置root密码,输入2次 ...
搭建nginx
Nginx ("engine x") 是一个高性能的HTTP和反向代理服务器,也是一个IMAP/POP3/SMTP服务器.Nginx是由Igor Sysoev为俄罗斯访问量第二的R ...
ASP.NET Core Web程序托管到Windows 服务
前言在 .NET Core 3.1和WorkerServices构建Windows服务我们也看到了,如何将workerservices构建成服务,那么本篇文章我们再来看看如何将web应用程序托管到 ...
【转】8 个效果惊人的 WebGL/JavaScript 演示
英文原文:9 IMPRESSIVE WEBGL JAVASCRIPT EFFECT SHOWCASE,翻译:iteye WebGL 是一种 3D 绘图标准,这种绘图技术标准允许把 JavaScript ...
SpringCloud-Hystrix原理
Hystrix官网的原理介绍以及使用介绍非常详细,非常建议看一遍,地址见参考文档部分. 一 Hystrix原理 1 Hystrix能做什么通过hystrix可以解决雪崩效应问题,它提供了资源隔离.降 ...
Maven 基础环境搭建项目依赖jar包导入
一.创建一个Maven工程不清楚的话请查阅其它文档. 二.引入项目依赖的jar包 1.Spring 2.SpringMvc 3.Mybatis 4. 数据库连接池,驱动 5.其它(jstl.serv ...
JDBC超时设置【转】
恰当的JDBC超时设置能够有效地减少服务失效的时间.本文将对数据库的各种超时设置及其设置方法做介绍. 真实案例:应用服务器在遭到DDos攻击后无法响应在遭到DDos攻击后,整个服务都垮掉了.由于第四 ...

3、MySQL 索引失效的场景

3、MySQL 索引失效的场景的更多相关文章

随机推荐

热门专题