MYSQL 排序和分组

一.MYSQL 中有两种排序方式：

1：通过有序索引顺序扫描直接返回有序数据，这种方式在使用explain 分析查询的时候显示为Using Index ,不需要额外的排序，操作效率较高。

2: 是通过对返回数据进行排序，也就是通常说的filesort 排序，所有不是通过索引直接返回排序结果都叫filesort排序。filesort 并不代表磁盘文件进行排序，而只是说明了进行一个排序操作，至于排序操作是否使用了磁盘文件或临时表等，则取决于mysql 服务器对排序参数的设置和需要排序数据的大小。例如，按照商店store_id 排序返回所有客户记录时，出现了对全表扫描的结果排序：

explain select * from customer order by store_id

Extra : Using filesort

又如，只需要获取商店store_id 和顾客email 信息时，对表customer 的扫描就被覆盖索引idx_storeid_email 扫描替代，此时虽然只访问了索引就足够，但是在索引idx_stored_email 上发生了一次排序操作，所以执行计划仍然有 using filesort.

alter table customer add index idx_storeid_email(store_id,email);

explain select store_id ,email ,customer_id from customer order by email

extra :Using Index ,Using filesort

Filesort 是通过相应的排序算法，将取得的数据在sort_buffer_size 系统变量设置的内存排序区中进行排序，如果内存装载不下，它就会将磁盘上的数据进行分区，再对各个数据块进行排序，然后将各个块合并成有序的结果集。sort_buffer_size 设置的排序区是每个线程独占的，所以同一个时刻，mysql 中存在多个sort buffer 排序区.

了解了mysql 排序的方式，优化目标就清晰了：尽量减少额外的排序，通过索引直接返回有序数据。where 条件和order by 使用相同的索引，并且order by 的顺序和索引顺序相同，并且order by 的字段都是生序或者都是降序，否则肯定需要额外的排序操作，这样就会出现filesort.

总结，下列SQL 可以使用索引：

select * from tabname order by key_part1,key_part2,......;

select * from tabname where key_part1 order by key_part1 desc ,key_part2 desc;

select * from tabname order by key_part1,key_part2 desc;

但是在以下几种情况下则不使用索引：

select * from tabname order by key_part1 desc ,key_part2 asc;

-- order by 的字段混合ASC 和 DESC

select * from tabname where key2=constant order by key1;

-- 用于查询行的关键字与order by 中所使用的不相同

select * from tabname order by key1,key2;

-- 对不同的关键字使用order by :

二.Filesort 的优化

通过创建合适的索引能够减少filesort 出现，但是在某些情况下，条件限制不能让filesort 消失，那就需要想办法加快 filesort 的操作。对于filesort ,MYSQL 有两种排序算法。

1.两次扫描算法（Two passes）:首先根据条件取出排序字段和行指针信息，之后在排序区sort buffert 中排序。如果排序区sort buffer 不够，则在临时表temporary table 中存储排序结果。完成排序后根据行指针回表读取记录。该算法是mysql 4.1 之前采用的算法，需要两次访问数据，第一次获取排序字段和行指针信息，第二次根据行指针获取记录，尤其是第二次读取操作可能导致大量随机 I/O 操作；优点是排序的时候内存呢开销哦较少。

2. 一次扫描算法（Single pass）:一次行取出满足条件的行的所有字段，然后在排序区sort buffer 中排序后直接输出结果集。排序的时候内存开销比较大，但是排序效率比两次扫描算法要高。

MySQL 通过比较系统变量 max_length_for_sort_data 的大小和Query 语句取出的字段总大小来判断使用哪种排序算法。如果 max_length_for_sort_data更大，那么使用第二种优化之后的算法；否则使用第一种算法。

适当加大系统变量max_length_for_sort_data 的值，能够让 mysql 选择更优化的filesort 排序算法。当然，假如 max_length_for_sort_data 设置过大，会造成cpu 利用率过低和磁盘I/ O过高，cpu 和I/O利用平衡就足够了。

适当加大sort_buffer_size 排序区，尽量让排序在内存中完成，而不是通过创建临时表放在文件中进行；当然也不能无限制加大 sort_buffer_size 排序区，因为sort_buffer_size 参数是每个线程独占的，设置过大，会导致服务器SWAP 严重，要考虑数据库活动连接数和服务器内存的大小来适当设置排序区。

尽量使使用必要的字段，select 具体的字段名称，而不是 select * 选择所有字段，这样可以减少排序区的使用，提高SQL 性能。

三. 优化 Group BY 语句

如果查询包含Group by 但用户想要避免排序结果的消耗，则可以指定order by null 禁止排序。

explain select payment_date,sum(amount) from payment group by payment_fate

extra : Using temporary;Using filesort

explain select payment_date,sum(amount) from payment_date order by null

extra : Using temporary

MYSQL 排序和分组的更多相关文章

MySQL的外键，修改表，基本数据类型，表级别操作，其他（条件，通配符，分页，排序，分组，联合，连表操作）
MySQL的外键,修改表,基本数据类型,表级别操作,其他(条件,通配符,分页,排序,分组,联合,连表操作): a.创建2张表 create table userinfo(nid int not nul ...
MySql下实现先排序后分组
最近在工作中遇到一个先排序后分组的需求,发现MySql不同的版本有不同的结果,特此记录. 举例:要求在shop表中查询出各类型商店中价格最高的商品. --表结构-- create table `sho ...
mysql 怎样先排序再分组
权游游牧族:众所周知!一句SqL语句不能先排序再分组.所以这里给出几个案例 --表结构-- create table `shop` ( `id` int (10) PRIMARY KEY, `shop ...
MySQL进阶5--分组函数 / 分组排序和分组查询 group by(having) /order by
MySQL进阶--分组排序和分组查询 group by(having) /order by /* 介绍分组函数功能:用做统计使用,又称为聚合函数或组函数 1.分类: sum, avg 求和 /平均数 ...
MySQL最常用分组聚合函数
一.聚合函数(aggregation function)---也就是组函数在一个行的集合(一组行)上进行操作,对每个组给一个结果. 常用的组函数: AVG([distinct] expr) 求平均值 ...
ElasticSearch6.0 Java API 使用排序，分组，创建索引，添加索引数据，打分等（一）
ElasticSearch6.0 Java API 使用排序,分组 ,创建索引,添加索引数据,打分等如果此文章对你有帮助,请关注一下哦 1.1 搭建maven 工程创建web工程 ...
sql中实现先排序后分组
数据表结构和数据如下: CREATE TABLE `commun_message_chat_single` ( `id` ) NOT NULL AUTO_INCREMENT, `chat_id` ) ...
DQL语句排序与分组
DQL语句排序与分组一.DQL-排序排序是计算机内经常进行的一种操作,其目的是将一组"无序"的记录序列调整为"有序"的记录序列.分内部排序和外部排序,若整个 ...
Hadoop学习笔记—11.MapReduce中的排序和分组
一.写在之前的 1.1 回顾Map阶段四大步骤首先,我们回顾一下在MapReduce中,排序和分组在哪里被执行: 从上图中可以清楚地看出,在Step1.4也就是第四步中,需要对不同分区中的数据进行排 ...

随机推荐

微信小程序H5预览页面框架（二维码不隐藏）
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content ...
中阶d03.1 JDBCDemo
1. jdbc使用查看驱动的doc文档<connector-j.html> 2.代码实现:1. 注册驱动---2. 建立连接---3. 创建statement ,跟数据库打交道--- -- ...
Linux 下发送邮件
由于种种原因,需要由我这个兼职运维每天发送对账单文件给运营同学,故研究下 Linux 发送邮件,希望对大家有所帮助. 安装 # Centos,安装 mailx $ yum install -y mai ...
mybatis一级缓存让我憔悴
Mybatis对缓存提供支持,是默认开启一级缓存. 来一段代码,这边使用的是mybatis-plus框架,通过构建 QueryWrapper 查询类来实现的. @Transactional publi ...
我是如何一步步的在并行编程中将lock锁次数降到最低实现无锁编程
在并行编程中,经常会遇到多线程间操作共享集合的问题,很多时候大家都很难逃避这个问题做到一种无锁编程状态,你也知道一旦给共享集合套上lock之后,并发和伸缩能力往往会造成很大影响,这篇就来谈谈如何尽可能 ...
腾讯云集群服务部署mysql并挂载到服务器
一.背景由于现在大部分的应用都是运行在云服务器上的,而现在大多数文章都是主要写如何在服务器上使用docker去运行mysql,比较少有介绍云服务器上的.再加上现在k8s比较火爆,而云厂商大多数都提供 ...
详解 DatagramSocket类
(请观看本人博文 -- <详解网络编程>) DatagramSocket 概述: 这类代表一个发送和接收数据包的插座. 该类是遵循 UDP协议实现的一个Socket类. 数据报套接字发 ...
1. git 本地给远程仓库创建分支三步法
命令如下: 1:本地创建分支dev 1 2 Peg@PEG-PC /D/home/myself/Symfony (master) $ git branch dev 2:下面是把本地分支提交到远程仓库 ...
9. 弹出键盘挡住input
1.) react 中 <input className="inp3" placeholder="密码" type="password" ...
5. iphone 的:active样式
如果给按钮定义 :hover 样式,在 iPhone 上按钮点击一次是 hover 态,再点击一次 hover 态才会消失,这不是我们想要的,继而想通过定义 :active 样式来实现按钮按下时的效果 ...

MYSQL 排序和分组

MYSQL 排序和分组的更多相关文章

随机推荐

热门专题