1226关于count(*)不走主键索引反而走二级索引

转自 http://www.2cto.com/database/201508/433975.html

mysqlcount(*)会选哪个索引？

2015-08-19 0个评论来源：Database、Code

我要投稿

今天在查询一个表行数的时候，发现count(1)和count(*)执行效率居然是一样的。这跟Oracle还是有区别的。遂查看两种方式的执行计划：

mysql> select count(1) from customer;

+----------+

| count(1) |

+----------+

| 150000 |

+----------+

1 row in set (0.03 sec)

mysql> flush tables;

Query OK, 0 rows affected (0.00 sec)

mysql> select count(*) from customer;

+----------+

| count(*) |

+----------+

| 150000 |

+----------+

1 row in set (0.03 sec)

查看执行计划：

mysql> explain select count(1) from customer;

+----+-------------+----------+-------+---------------+---------------+---------+------+--------+-------------+

| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |

+----+-------------+----------+-------+---------------+---------------+---------+------+--------+-------------+

| 1 | SIMPLE | customer | index | NULL | i_c_nationkey | 5 | NULL | 151191 | Using index |

+----+-------------+----------+-------+---------------+---------------+---------+------+--------+-------------+

1 row in set (0.00 sec)

mysql> explain select count(*) from customer;

+----+-------------+----------+-------+---------------+---------------+---------+------+--------+-------------+

| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |

+----+-------------+----------+-------+---------------+---------------+---------+------+--------+-------------+

| 1 | SIMPLE | customer | index | NULL | i_c_nationkey | 5 | NULL | 151191 | Using index |

+----+-------------+----------+-------+---------------+---------------+---------+------+--------+-------------+

1 row in set (0.00 sec)

mysql> show index from customer;

+

----------+------------+---------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

+

----------+------------+---------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

| customer | 0 | PRIMARY | 1 | c_custkey | A | 150525 | NULL | NULL | | BTREE | | |

| customer |          1 | i_c_nationkey |            1 | c_nationkey | A         |          47 |

+

----------+------------+---------------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

2 rows in set (0.08 sec)

发现不管是count(1)或count(*)都是走的i_c_nationkey这个索引。平时我们检索数据的时候肯定是主键索引效率高，那么我们强制主键索引来看看：

mysql> select count(*) from customer force index(PRIMARY);

+----------+

| count(*) |

+----------+

| 150000 |

+----------+

1 row in set (0.68 sec)

mysql> explain select count(*) from customer force index(PRIMARY);

+----+-------------+----------+-------+---------------+---------+---------+------+--------+-------------+

| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |

+----+-------------+----------+-------+---------------+---------+---------+------+--------+-------------+

| 1 | SIMPLE | customer | index | NULL | PRIMARY | 4 | NULL | 150525 | Using index |

+----+-------------+----------+-------+---------------+---------+---------+------+--------+-------------+

1 row in set (0.00 sec)

可以看到走主键索引的时候效率比较差。那么是为什么呢。
平时我们检索一列的时候，基本上等值或范围查询，那么索引基数大的索引必然效率很高。但是在做count(*)的时候并没有检索具体的一行或者一个范围。那么选择基数小的索引对
count操作效率会更高。在做count操作的时候，mysql会遍历每个叶子节点，所以基数越小，效率越高。mysql非聚簇索引叶子节点保存的主键ID，所以需要检索两遍索引。但是这里相对于遍历主键索引。及时检索两遍索引效率也比单纯的检索主键索引快。
那么再以一个表作为证明：

mysql> explain select count(*) from lineitem;

+----+-------------+----------+-------+---------------+--------------+---------+------+---------+-------------+

| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |

+----+-------------+----------+-------+---------------+--------------+---------+------+---------+-------------+

| 1 | SIMPLE | lineitem | index | NULL | i_l_shipdate | 4 | NULL | 6008735 | Using index |

+----+-------------+----------+-------+---------------+--------------+---------+------+---------+-------------+

1 row in set (0.00 sec)

mysql> show index from lineitem;

+

----------+------------+-----------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

| Table

| Non_unique | Key_name              | Seq_in_index | Column_name   | Collation | Cardinality | Sub_part | Packed |

Null | Index_type | Comment | Index_comment |

+

----------+------------+-----------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

| lineitem | 0 | PRIMARY | 1 | l_orderkey | A | 2997339 | NULL | NULL | | BTREE | | |

| lineitem | 0 | PRIMARY | 2 | l_linenumber | A | 5994679 | NULL | NULL | | BTREE | | |

| lineitem |          1 | i_l_shipdate          |            1 | l_shipDATE    | A         |        5208 |

| lineitem |          1 | i_l_suppkey_partkey   |            1 | l_partkey     | A         |      428191 |

| lineitem |          1 | i_l_suppkey_partkey   |            2 | l_suppkey     | A         |     1998226 |

| lineitem |          1 | i_l_partkey           |            1 | l_partkey     | A         |      461129 |

| lineitem |          1 | i_l_suppkey           |            1 | l_suppkey     | A         |       19213 |

| lineitem |          1 | i_l_receiptdate       |            1 | l_receiptDATE | A         |          17 |

| lineitem |          1 | i_l_orderkey          |            1 | l_orderkey    | A         |     2997339 |

| lineitem |          1 | i_l_orderkey_quantity |            1 | l_orderkey    | A         |     1998226 |

| lineitem |          1 | i_l_orderkey_quantity |            2 | l_quantity    | A         |     5994679 |

| lineitem |          1 | i_l_commitdate        |            1 | l_commitDATE  | A         |        7836 |

+

----------+------------+-----------------------+--------------+---------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

12 rows in set (0.96 sec)

这里一看l_shipDATE并不是基数最小的呀，殊不知这个统计信息是不准确的。我们用sql看一下。

mysql> select count(distinct(l_shipDATE)) from lineitem;

+-----------------------------+

| count(distinct(l_shipDATE)) |

+-----------------------------+

| 2526 |

+-----------------------------+

1 row in set (0.01 sec)

那么比他小的那些列呢？

mysql> select count(distinct(l_receiptDATE)) from lineitem;

+--------------------------------+

| count(distinct(l_receiptDATE)) |

+--------------------------------+

| 2554 |

+--------------------------------+

1 row in set (0.01 sec)

其他就不看了，这里再次说明mysql选择了基数小的索引。

1226关于count(*)不走主键索引反而走二级索引的更多相关文章

mysql InnoDB index 主键采用聚簇索引，二级索引不采用聚簇索引
原文链接我的归纳: (1)InnoDB的主键采用聚簇索引存储,使用的是B+Tree作为索引结构,但是叶子节点存储的是索引值和数据本身(注意和MyISAM的不同). (2)InnoDB的二级索引不使用 ...
【mysql优化】mysql count(*)、count(1)、count(主键字段)、count(非主键字段）哪个性能最佳
测试结果为:count(*)和count(1)基本相等,count(非主键字段)最耗性能 -- 数据量 708254select count(*) from tmp_test1;-- avg 0.22 ...
Oracle删除主键约束的同时删除索引
继续昨天的折腾(Oracle修改主键约束),删掉主键约束后,发现唯一索引并未删掉.仔细看了下,主键约束跟唯一索引名称不一样,这说明是先创建了唯一索引,后创建的主键约束.我们来试验下: SQL> ...
主键primary key和唯一索引unique index
1)主键一定是唯一性索引,唯一性索引并不一定就是主键. 2)主键就是能够唯一标识表中某一行的属性或属性组,一个表只能有一个主键,但可以有多个候选索引. 3)主键常常与外键构成参照完整性约束,防止出现数 ...
mysql 主键和默认设为索引的规则
一.mysql 表中如果是单主键的话,那这个主键也会被系统默认建为索引二.mysql 表中如果是复合主键的话,那系统会遵循左对齐原则,即如复合主键 a 和 b字段和c字段..., 默认建的主键索 ...
MySQL 聚簇索引&&二级索引&&辅助索引
MySQL非聚簇索引&&二级索引&&辅助索引 mysql中每个表都有一个聚簇索引(clustered index ),除此之外的表上的每个非聚簇索引都是二级索引,又叫辅 ...
COUNT(*)、COUNT(主键)、COUNT(1)
MyISAM引擎,记录数是结构的一部分,已存cache在内存中; InnoDB引擎,需要重新计算,id是主键的话,会加快扫描速度: 所以select count(*) MyISAM完胜! MyISA ...
图解MySQL：count(*) 、count(1) 、count(主键字段)、count(字段）哪个性能最好？
大家好,我是小林. 当我们对一张数据表中的记录进行统计的时候,习惯都会使用 count 函数来统计,但是 count 函数传入的参数有很多种,比如 count(1).count(*).count(字段 ...
MySQL的几个概念：主键，外键，索引，唯一索引
概念: 主键(primary key) 能够唯一标识表中某一行的属性或属性组.一个表只能有一个主键,但可以有多个候选索引.主键常常与外键构成参照完整性约束,防止出现数据不一致.主键可以保证记录的唯一和 ...

随机推荐

LCM性质 + 组合数 - HDU 5407 CRB and Candies
CRB and Candies Problem's Link Mean: 给定一个数n,求LCM(C(n,0),C(n,1),C(n,2)...C(n,n))的值,(n<=1e6). analy ...
[MEF插件式开发] 一个简单的例子
偶然在博客园中了解到这种技术,顺便学习了几天. 以下是搜索到一些比较好的博文供参考: MEF核心笔记 <MEF程序设计指南>博文汇总先上效果图一.新建解决方案开始新建一个解决方案Me ...
jquery对单选和下拉框的操作
jquery 对表单的操作: 对单选框的操作: 一.对单选框的操作: 1.$('input
Linux归档压缩、分区管理与LVM管理
归档和压缩命令: 命令格式: gzip [-9] 文件名 bzip2 [-9] 文件名 gzip –d .gz格式的压缩文件 bzip2 –d .bz2格式的压缩文件选项: -9:高压缩比,多用于压 ...
Atitit.eclise的ide特性-------abt 编译
Atitit.eclise的ide特性-------abt 编译为什么要在Intellij IDEA中使用Eclipse编译器如果你使用Intellij Idea,你应该考虑使用Eclipse编译 ...
在centos 服务器上安装phalcon框架 undefined symbol: php_pdo_get_dbh_ce
去git 下载对应版本的框架命令行: sudo yum install php-devel pcre-devel gcc make 然后使用GIT clone到服务器上,然后 git clone g ...
jvm内存溢出分析
概述 jvm中除了程序计数器,其他的区域都有可能会发生内存溢出内存溢出是什么? 当程序需要申请内存的时候,由于没有足够的内存,此时就会抛出OutOfMemoryError,这就是内存溢出内存溢出和 ...
git&&github使用方法总结
vn / git作用:在多人协作开发过程中,我们使用git负责项目源代码的版本管理,所有的开发人员操作的是同一个仓库中的源码 1.创建一个远程的仓库(在gitHub上) 2.创建一个本地的仓库新建文 ...
ng-option指令使用记录，设置默认值需要注意
ng-options一般有以下用法: 数组作为数据源: label for value in array select as label for value in array label group ...
html5上传图片(一)一跨域上传
最近开发一个上传图片的模块,传图片的接口不支持跨域上传,并且只支持单张上传,而我们的产品要求要实现多张上传.我搞了一个代理页面,先将图片传到代理页面,然后再通过代理页面传到上传图片接口.虽然这种方式经 ...

1226关于count(*)不走主键索引反而走二级索引

1226关于count(*)不走主键索引反而走二级索引的更多相关文章

随机推荐

热门专题