在explain我们所使用的sql的时候,经常会遇到using
filesort这种情况,原以为是由于有相同列值的原因引起,结果昨天看到公司的一个sql,跟同事讨论了下加上自己又做了一些测试,突然发现自己原来的想法是错误的。

首先,只有在order by
数据列的时候才可能会出现using filesort,而且如果你不对进行order
by的这一列设置索引的话,无论列值是否有相同的都会出现using filesort。因此,只要用到order
by 的这一列都应该为其建立一个索引。

其次,在这次测试中,使用了一个稍微有点复杂的例子来说明这个问题,下面详细用这个例子说一下:

SELECT * FROM DB.TB WHERE ID=2222 AND FID IN (9,8,3,13,38,40)ORDER BY INVERSE_DATE LIMIT 0, 5

里面建立的索引为一个三列的多列索引:IDX(ID,FID
,INVERSE_DATE)。INVERSE_DATE这个是时间的反向索引。

对于这个sql我当时最开始认为应该是个优化好的状态,应该没有什么纰漏了,结果一explain才发现竟然出现了:Using
where; Using filesort。

为什么呢,后来经过分析才得知,原来在多列索引在建立的时候是以B-树结构建立的,因此建立索引的时候是先建立ID的按顺序排的索引,在相同ID的情况下建立FID按顺序排的索引,最后在FID
相同的情况下建立按INVERSE_DATE顺序排的索引,如果列数更多以此类推。有了这个理论依据我们可以看出在这个sql使用这个IDX索引的时候只是用在了order
by之前,order by INVERSE_DATE
实际上是using filesort出来的。。汗死了。。因此如果我们要在优化一下这个sql就应该为它建立另一个索引IDX(ID,INVERSE_DATE),这样就消除了using
filesort速度也会快很多。问题终于解决了。

二、http://blog.csdn.net/yangyu112654374/article/details/4251624

用Explain分析SQL语句的时候,经常发现有的语句在Extra列会出现Using
filesort,根据mysql官方文档对他的描述:

引用

MySQLmust do an extra pass to find out how to retrieve the rows in sorted order. Thesort is done by going through all rows according
to the join type and storingthe sort key and pointer to the row for all rows that match the WHERE clause.

中文手册上翻译的很别扭:

引用

“Mysql需要额外的一次传递,以找出如何按排序顺序检索行,通过根据联接类型浏览所有行并为所有匹配where子句的行保存排序关键字和行的指针来完成排序,然后关键字被排序,并按排序顺序检索行。”

总的来说,Using filesort
是Mysql里一种速度比较慢的外部排序,如果能避免是最好的了,很多时候,我们可以通过优化索引来尽量避免出现Using
filesort,从而提高速度。



这里举个简单的例子:

CREATETABLE `testing` (

   `id` int(10) unsigned NOT NULLauto_increment,

   `room_number` int(10) unsigned NOTNULL default '0',

   PRIMARY KEY   (`id`),

   KEY `room_number` (`room_number`)

) ENGINE=MyISAM DEFAULT CHARSET=latin1

写个存储过程askwan,插入10万条测试数据

mysql>DELIMITER $$

DROP PROCEDUREIF EXISTS `askwan`.`askwan` $$

CREATE PROCEDURE `askwan`.`askwan` ()

BEGIN

     DECLARE v INT DEFAULT 1;

             WHILE v<100000;

                   DO

                   INSERT INTO testingVALUES(v,v);

                   SET v=v+1;

             END WHILE;



END $$

mysql>DELIMITER ;

mysql>CALL askwan();

Query OK, 1 row affected (13.21 sec)

OK,数据准备好了,开始试验。



由上面例子中建立的表信息,我已经建立了两个索引,一个主键id,一个room_number列索引

那现在来看一条SQL,

SELECTid FROM testing WHERE room_number=1000 ORDER BY id ;

分析一下

mysql>EXPLAIN SELECT id FROM testing WHERE room_number=1000 ORDER BY id ;

+----+-------------+---------+------+---------------+-------------+---------+-------+------+-----------------------------+

| id | select_type | table     | type |possible_keys | key           | key_len | ref     | rows | Extra                         |

+----+-------------+---------+------+---------------+-------------+---------+-------+------+-----------------------------+

|    1 | SIMPLE        | testing | ref    | room_number     | room_number | 4         | const |      1 | Using where; Using filesort |

+----+-------------+---------+------+---------------+-------------+---------+-------+------+-----------------------------+

1 row in set (0.00 sec)

出现了Usingfilesort,并且用到了room_number这列索引,但是,在这里用到的索引是针对WHERE后面的room_number条件的,而最后面的排序是根据id来的,这就是手册中说的,“额外的一次排序”!,于是就会出现Using
filesort,根据我以前写过的一文章,我再建立一个联合索引 room_number_id

altertable testing add index room_number_id(room_number,id);

在来分析一下

mysql>EXPLAIN SELECT id FROM testing WHERE room_number=1000 ORDER BY id ;

+----+-------------+---------+------+----------------------------+----------------+---------+-------+------+--------------------------+

| id | select_type | table     | type |possible_keys                | key              | key_len | ref     | rows | Extra                      |

+----+-------------+---------+------+----------------------------+----------------+---------+-------+------+--------------------------+

|    1 | SIMPLE        | testing | ref    | room_number,room_number_id | room_number_id| 4         | const |      1 | Using where;    |

+----+-------------+---------+------+----------------------------+----------------+---------+-------+------+--------------------------+

1 row in set (0.00 sec)

现在Usingfilesort不见了。



总结一下: 


   1.一般有order by语句,在索引加得不当的情况下,都有可能出现Using filesort,这时候就要对SQL语句和索引进行优化了,但是,并不是说出现Using
filesort就是个严重的问题,不是这样的,此次举的例子比较极端,几乎不太可能出现这么傻瓜的查询,优化和不优化,要看它是不是影响了业务性能。

   2. 从上面可以看到联合索引,也可以叫多列索引,形如 key ('A1','A2','A3' ,'A4')等的,排序的思路一般是,先按照A1来排序,A1相同,然后按照A2排序,以此类推,这样对于(A1),(A1,A2),
(A1,A2,A3)的索引都是有效的,但是对于(A2,A3)这样的索引就无效了。

mysql filesort 的解决方案的更多相关文章

  1. 高可用性、负载均衡的mysql集群解决方案

    高可用性.负载均衡的mysql集群解决方案 一.mysql的市场占有率 二.mysql为什么受到如此的欢迎 三.mysql数据库系统的优缺点 四.网络服务器的需求 五.什么是mysql的集群 六.什么 ...

  2. MySQL高可用解决方案(MySQL HA Solution)

    http://blog.sina.com.cn/s/blog_7e89c3f501012vtr.html 什么是高可用性?很多公司的服务都是24小时*365天不间断的.比如Call Center.这就 ...

  3. (转)MySQL高可用解决方案

    MySQL高可用解决方案 原文:http://www.ywnds.com/?p=5565 有这么两个概念,数据库的可靠性和数据库的可用性,可靠性指的是数据可靠,而可用性指的是服务可用.但是不管是可靠性 ...

  4. MySQL+navicat-1064 Error解决方案

    MySQL+navicat-1064 Error解决方案 错误 #1064 - You have an error in your SQL syntax; check the manual that ...

  5. 常见的MYSQL高可用解决方案

    MySQL 是一种关系数据库管理系统,关联数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性.MySQL 软件采用了双授权政策(本词条"授权政策& ...

  6. 重要业务MySQL冷备解决方案

    1.概述 在公司业务里面,当对应的业务数据不是很重要的时候,我们一般会简单的写个脚本,每天半夜把数据库数据全量拉取下来,备份到本地磁盘.但当业务比较重要的时候,这样简单操作会存在许多问题,比如本地磁盘 ...

  7. 优化MYSQL FILESORT

    用Explain分析SQL语句的时候,经常发现有的语句在Extra列会出现Using filesort,根据mysql官方文档对他的描述: 引用 MySQL must do an extra pass ...

  8. MySQL filesort优化案例一则

    今天遇到一个filesort优化的案例,感觉不错,分享出来. MySQL中filesort是什么意思?官方手册定义: MySQL must do an extra pass to find out h ...

  9. jbpm部署流程定义到MySql报乱码解决方案

    问题起因: 我在使用ant将流程定义和流程相关资源部署到JBPM数据库中的时候,报了下面一个错误. 错误提示,大概是: 11:33:40,781 ERROR JDBCExceptionReporter ...

随机推荐

  1. Git 中 SSH key 生成步骤

    由于本地Git仓库和GitHub仓库之间的传输是通过SSH加密的,所以必须要让github仓库认证你SSH key,在此之前,必须要生成SSH key. 第1步:创建SSH Key.在windows下 ...

  2. Http多线程版本

    上一篇文章讲了HTTP是如何通过TCP协议传输到服务器上,以及服务器接收到的报文信息请参考[HTTP与TCP的关系] 这篇文章主要讲述的多线程处理Http请求,关于多线程的好处我就不再叙述了.由于我们 ...

  3. iOS 选择排序

    简单选择排序的基本思想:(从小到大) 第1趟,在待排序记录r[1]~r[n]中选出最小的记录,将它与r[1]交换: 第2趟,在待排序记录r[2]~r[n]中选出最小的记录,将它与r[2]交换: 以此类 ...

  4. JavaScript 对象JavaScript 对象

    JavaScript 中的所有事物都是对象:字符串.数值.数组.函数... 此外,JavaScript 允许自定义对象. 所有事物都是对象 JavaScript 提供多个内建对象,比如 String. ...

  5. Ubuntu命令行启动Matlab

    原文转自:http://blog.csdn.net/striker_v/article/details/52884485 小编安装的是Matlab R2015b,使用的是默认安装目录,安装在目录/us ...

  6. springMVC源码分析--ModelFactory

    ModelFactory是用来维护Model的,具体包含两个功能 (1)初始化Model (2)处理器执行后将Model中相应的参数更新到SessionAttributes中 1.初始化Model其实 ...

  7. RxJava(九)zip操作符在Android中的实际使用场景

    欢迎转载,转载请标明出处: http://blog.csdn.net/johnny901114/article/details/51614927 本文出自:[余志强的博客] 一.zip操作符概述 官方 ...

  8. Apache Beam—透视Google统一流式计算的野心

    Google是最早实践大数据的公司,目前大数据繁荣的生态很大一部分都要归功于Google最早的几篇论文,这几篇论文早就了以Hadoop为开端的整个开源大数据生态,但是很可惜的是Google内部的这些系 ...

  9. TBschedule入门

    tbschedule 淘宝的wiki: http://code.taobao.org/p/tbschedule/wiki/index/ 截取内容如下: 此文档内部包括: 1.设计目标说明 2.主要概念 ...

  10. 4.1、Android Stuido配置你的Build Variant

    每个版本的build variant代表了你可以构建的每一个版本.虽然你未直接配置build variants,你可以通过配置build type和product flavor. 比如,一个demo的 ...