sql优化分三个方向
SQL 规范性检查
select 检查
UDF 用户自定义函数
SQL 语句的 select 后面使用了自定义函数 UDF,SQL 返回多少行,那么 UDF 函数就会被调用多少次,这是非常影响性能的。
#getOrderNo 是用户自定义一个函数用户来根据 order_sn 来获取订单编号
select id, payment_id, order_sn, getOrderNo(order_sn) from payment_transaction where status = 1 and create_time between '2020-10-01 10:00:00' and '2020-10-02 10:00:00';
text 类型检查
如果 select 出现 text 类型的字段,就会消耗大量的网络和 IO 带宽,由于返回的内容过大超过 max_allowed_packet 设置会导致程序报错,需要评估谨慎使用。
#表 request_log 的中 content 是 text 类型。
select user_id, content, status, url, type from request_log where user_id = 32121;
group_concat 谨慎使用
gorup_concat 是一个字符串聚合函数,会影响 SQL 的响应时间,如果返回的值过大超过了 max_allowed_packet 设置会导致程序报错。
select batch_id, group_concat(name) from buffer_batch where status = 0 and create_time between '2020-10-01 10:00:00' and '2020-10-02 10:00:00';
内联子查询
在 select 后面有子查询的情况称为内联子查询,SQL 返回多少行,子查询就需要执行过多少次,严重影响 SQL 性能。
select id,(select rule_name from member_rule limit 1) as rule_name, member_id, member_type, member_name, status
from member_info m where status = 1 and create_time between '2020-09-02 10:00:00' and '2020-10-01 10:00:00';
from 检查
表的链接方式
在 MySQL 中不建议使用 Left Join,即使 ON 过滤条件列索引,一些情况也不会走索引,导致大量的数据行被扫描,SQL 性能变得很差,同时要清楚 ON 和 Where 的区别。
SELECT a.member_id,a.create_time,b.active_time
FROM operation_log a LEFT JOIN member_info b ON a.member_id = b.member_id where b.`status` = 1
and a.create_time between '2020-10-01 00:00:00' and '2020-10-30 00:00:00' limit 100, 0;
子查询
由于 MySQL 的基于成本的优化器 CBO 对子查询的处理能力比较弱,不建议使用子查询,可以改写成 Inner Join。
select b.member_id,b.member_type, a.create_time,a.device_model
from member_operation_log a inner join (select member_id,member_type from member_base_info where `status` = 1
and create_time between '2020-10-01 00:00:00' and '2020-10-30 00:00:00') as b on a.member_id = b.member_id;
where 检查
索引列被运算
当一个字段被索引,同时出现 where 条件后面,是不能进行任何运算,会导致索引失效。
#device_no 列上有索引,由于使用了 ltrim 函数导致索引失效
select id, name , phone, address, device_no from users where ltrim(device_no) = 'Hfs1212121';
#balance 列有索引,由于做了运算导致索引失效
select account_no, balance from accounts where balance + 100 = 10000 and status = 1;
类型转换
对于 Int 类型的字段,传 varchar 类型的值是可以走索引,MySQL 内部自动做了隐式类型转换;相反对于varchar 类型字段传入 Int 值是无法走索引的,应该做到对应的字段类型传对应的值总是对的。
#user_id 是 bigint 类型,传入 varchar 值发生了隐式类型转换,可以走索引。
select id, name , phone, address, device_no from users where user_id = '23126';
#card_no 是 varchar(20),传入 int 值是无法走索引
select id, name , phone, address, device_no from users where card_no = 2312612121;
列字符集
从 MySQL 5.6 开始建议所有对象字符集应该使用用 utf8mb4,包括 MySQL 实例字符集,数据库字符集,表字符集,列字符集。避免在关联查询 Join 时字段字符集不匹配导致索引失效,同时目前只有 utf8mb4 支持 emoji 表情存储。
character_set_server = utf8mb4 #数据库实例字符集
character_set_connection = utf8mb4 #连接字符集
character_set_database = utf8mb4 #数据库字符集
character_set_results = utf8mb4 #结果集字符集
group by 检查
前缀索引
group by 后面的列有索引,索引可以消除排序带来的 CPU 开销,如果是前缀索引,是不能消除排序的。
#device_no字段类型varchar(200),创建了前缀索引。
mysql> alter table users add index idx_device_no(device_no(64)); mysql> select device_no, count(*) from users where create_time between '2020-10-01 00:00:00' and '2020-10-30 00:00:00' group by device_no;
函数运算
假设需要统计某月每天的新增用户量,参考如下 SQL 语句,虽然可以走 create_time 的索引,但是不能消除排序,可以考虑冗余一个字段 stats_date date 类型来解决这种问题。
select DATE_FORMAT(create_time, '%Y-%m-%d'), count(*) from users where create_time between '2020-09-01 00:00:00' and '2020-09-30 23:59:59'
group by DATE_FORMAT(create_time, '%Y-%m-%d');
order by 检查
前缀索引
order by 后面的列有索引,索引可以消除排序带来的 CPU 开销,如果是前缀索引,是不能消除排序的。
字段顺序
排序字段顺序,asc/desc 升降要跟索引保持一致,充分利用索引的有序性来消除排序带来的 CPU 开销。
limit 检查
limit m,n 要慎重
对于 limit m, n 分页查询,越往后面翻页即 m 越大的情况下 SQL 的耗时会越来越长,对于这种应该先取出主键 id,然后通过主键 id 跟原表进行 Join 关联查询。
表结构检查
表 & 列名关键字
在数据库设计建模阶段,对表名及字段名设置要合理,不能使用 MySQL 的关键字,如 desc, order, status, group 等。同时建议设置 lower_case_table_names = 1 表名不区分大小写。
表存储引擎
对于 OLTP 业务系统,建议使用 InnoDB 引擎获取更好的性能,可以通过参数 default_storage_engine 控制。
AUTO_INCREMENT 属性
建表的时候主键 id 带有 AUTO_INCREMENT 属性,而且 AUTO_INCREMENT=1,在 InnoDB 内部是通过一个系统全局变量 dict_sys.row_id 来计数,row_id 是一个 8 字节的 bigint unsigned,InnoDB 在设计时只给 row_id 保留了 6 个字节的长度,这样 row_id 取值范围就是 0 到 2^48 - 1,如果 id 的值达到了最大值,下一个值就从 0 开始继续循环递增,在代码中禁止指定主键 id 值插入。
#新插入的id值会从10001开始,这是不对的,应该从1开始。
create table booking( `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键id',......) engine = InnoDB auto_increment = 10000; #指定了id值插入,后续自增就会从该值开始+1,索引禁止指定id值插入。
insert into booking(id, book_sn) values(1234551121, 'N12121');
NOT NULL 属性
根据业务含义,尽量将字段都添加上 NOT NULL DEFAULT VALUE 属性,如果列值存储了大量的 NULL,会影响索引的稳定性。
DEFAULT 属性
在创建表的时候,建议每个字段尽量都有默认值,禁止 DEFAULT NULL,而是对字段类型填充响应的默认值。
COMMENT 属性
字段的备注要能明确该字段的作用,尤其是某些表示状态的字段,要显式的写出该字段所有可能的状态数值以及该数值的含义。
TEXT 类型
不建议使用 Text 数据类型,一方面由于传输大量的数据包可能会超过 max_allowed_packet 设置导致程序报错,另一方面表上的 DML 操作都会变的很慢,建议采用 es 或者对象存储 OSS 来存储和检索。
索引检查
索引属性
索引基数指的是被索引的列唯一值的个数,唯一值越多接近表的 count (*) 说明索引的选择率越高,通过索引扫描的行数就越少,性能就越高,例如主键 id 的选择率是 100%,在 MySQL 中尽量所有的 update 都使用主键 id 去更新,因为 id 是聚集索引存储着整行数据,不需要回表,性能是最高的。
mysql> select count(*) from member_info;
+----------+
| count(*) |
+----------+
| 148416 |
+----------+
1 row in set (0.35 sec) mysql> show index from member_base_info;
+------------------+------------+----------------------------+--------------+-------------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+------------------+------------+----------------------------+--------------+-------------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| member_info | 0 | PRIMARY | 1 | id | A | 131088 | NULL | NULL | | BTREE | | |
| member_info | 0 | uk_member_id | 1 | member_id | A | 131824 | NULL | NULL | | BTREE | | |
| member_info | 1 | idx_create_time | 1 | create_time | A | 6770 | NULL | NULL | | BTREE | | |
+------------------+------------+----------------------------+--------------+-------------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
#Table:表名
#Non_unique :是否为unique index,0-是,1-否。
#Key_name:索引名称
#Seq_in_index:索引中的顺序号,单列索引-都是1;复合索引-根据索引列的顺序从1开始递增。
#Column_name:索引的列名
#Collation:排序顺序,如果没有指定asc/desc,默认都是升序ASC。
#Cardinality:索引基数-索引列唯一值的个数。
#sub_part:前缀索引的长度;例如index (member_name(10),长度就是10。
#Packed:索引的组织方式,默认是NULL。
#Null:YES:索引列包含Null值;'':索引不包含Null值。
#Index_type:默认是BTREE,其他的值FULLTEXT,HASH,RTREE。
#Comment:在索引列中没有被描述的信息,例如索引被禁用。
#Index_comment:创建索引时的备注。
前缀索引
对于变长字符串类型 varchar (m),为了减少 key_len,可以考虑创建前缀索引,但是前缀索引不能消除 group by, order by 带来排序开销。如果字段的实际最大值比 m 小很多,建议缩小字段长度。
alter table member_info add index idx_member_name_part(member_name(10));
复合索引顺序
有很多人喜欢在创建复合索引的时候,总以为前导列一定是唯一值多的列,例如索引 index idx_create_time_status (create_time, status),这个索引往往是无法命中,因为扫描的 IO 次数太多,总体的 cost 的比全表扫描还大,CBO 最终的选择是走 full table scan。
MySQL 遵循的是索引最左匹配原则,对于复合索引,从左到右依次扫描索引列,到遇到第一个范围查询(>=, >,<, <=, between ….. and ….)就停止扫描,索引正确的索引顺序应该是 index idx_status_create_time (status, create_time)。
select account_no, balance from accounts where status = 1 and create_time between '2020-09-01 00:00:00' and '2020-09-30 23:59:59';
时间列索引
对于默认字段 created_at (create_time)、updated_at (update_time) 这种默认就应该创建索引,这一般来说是默认的规则。
sql优化分三个方向的更多相关文章
- SQL优化(三)—— 索引、explain分析
SQL优化(三)—— 索引.explain分析 一.什么是索引 索引是一种排好序的快速查找的数据结构,它帮助数据库高效的查询数据 在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据 ...
- oracle存储过程及sql优化-(三)
接下来介绍上篇接触到的存储过程中的sql语句 insert into TMP_GT3_sbfgl_WJSTJB SELECT NSR.NSRSBH, NSR.NSRMC, NSR.SCJYDZ, ca ...
- sql优化 分字段统计查询
select count(1) from pd_xxx_origin_xxx_data where create_time like '2019-02-23%' and source='20036' ...
- SQL优化策略
mysql添加索引 1.主键索引LATER TABLE 'table_neme' ADD PRIMARY KEY('column');2.唯一索引unique空串(null)可以放多个 如果是具体的内 ...
- 系统优化怎么做-SQL优化
大家好,这里是「聊聊系统优化 」,并在下列地址同步更新 博客园:http://www.cnblogs.com/changsong/ 知乎专栏:https://zhuanlan.zhihu.com/yo ...
- mysql优化(三)–explain分析sql语句执行效率
mysql优化(三)–explain分析sql语句执行效率 mushu 发布于 11个月前 (06-04) 分类:Mysql 阅读(651) 评论(0) Explain命令在解决数据库性能上是第一推荐 ...
- SQL语法集锦三:合并列值与分拆列值
本文转载http://www.cnblogs.com/lxblog/archive/2012/09/29/2708724.html 在SQL中分拆列值和合并列值老生常谈了,从网上搜刮了一下并记录下来, ...
- 梁敬彬老师的《收获,不止SQL优化》,关于如何缩短SQL调优时间,给出了三个步骤,
梁敬彬老师的<收获,不止SQL优化>,关于如何缩短SQL调优时间,给出了三个步骤, 1. 先获取有助调优的数据库整体信息 2. 快速获取SQL运行台前信息 3. 快速获取SQL关联幕后信息 ...
- SQL 优化总结(三) SQL子句
SQL子句 尽可能编写优化器可以优化的语句. 1. SELECT子句 (1) 在查询Select语句中用Where字句限制返回的行数,避免表扫描,如果返回不必要的数据,浪费了服务器的I/O资源,加重了 ...
- SQL优化系列(三)- 用最少的索引获得最大的性能提升
从全局出发优化索引 对于高负载的数据库,如何创建最少的索引,让数据库的整体性能提高呢?例如,对于100 条SQL语句,如何创建最佳的5条索引? SQL自动优化工具SQL Tuning Expert P ...
随机推荐
- 怎么把百度地图的搜索结果全部导出到Excel文件
有很多人问我,怎么样能够快速的把BAIDU地图左边的搜索列表里的商家地图,电话,导出到EXCEL里. 我就开发了一个小软件,专门为快速的实现导出数据到EXCEL. 为了使用方便,已经将全国的所又省份, ...
- 记D365开发的最佳实践
前端JS 不同的需求应该划分模块,以便日后修改,也是为了职责分离,模块分离,日后如果想分离到单独的JS文件里面也是比较方便: 对于公共的查询函数,应该做缓存,优先使用sessionStorage. 多 ...
- Centos安装后出现please make your choice from '1' to eter the license information spoke | 'q' to quit |'c' to continue |'r' to refresh
这是要求用户阅读或者接收协议: 解决方法:输入"1",按Enter键 阅读许可协议,输入"2",按Enter键 接受许可协议,输入"q" ...
- tsc条码打印机如何导入表格批量打印
很多时候,我们在TSC条码打印机的权昌条码打印软件里做标签时,涉及数据特别大,都保存在EXCLE表格里,那要怎么做,才可以使软件批量打印EXCEL数据呢?下面,小编就教教大家一种简单的批量打印标签的方 ...
- vscode 开发Vue项目
写在开头 Vue作为前端项目,本身不依赖IDE,完全可以使用任何文本编辑器进行开发.我使用vscode仅是因为比较习惯,vscode几乎可以作为任何项目的开发IDE. 环境安装 安装nodejs,去官 ...
- 面试视频知识点整理1-7(http协议)
http协议类 1)http协议的主要特点 简单快速 统一资源符 灵活 通过http协议,可以修改http头,完成不同数据类型的传输 无连接 ...
- 小程序中使用less
小程序中使用Less 原生小程序不支持less,其他基于小程序的框架大体都支持,如wepy,mpvue,taro等.但是仅仅因为一个less功能,而且引入一个框架,肯定是不可取的.因此可以用以下方式来 ...
- Qt中QGraphicsScene和QraphicsView显示坐标问题解决
相信打开这个界面的你,一定遇到了这两玩意儿设置完坐标发现对不上的问题...查询Qt官方文档后发现: 网上搜索了一番,基本上这个坐标系就是长酱紫: 所以加上这行代码就行了: ui->graphic ...
- tomcat的安装以及环境配置
1.Tomcat的下载地址:http://tomcat.apache.org/ Tomcat是开放源代码的WEB服务器,安装时,只需解压压缩包即可 2.环境变量的配置 1>新建系统变量CATAL ...
- Java-Maven实现简单的文件上传下载(菜鸟一枚、仅供参考)
1.JSP页面代码实现 <%@ page language="java" contentType="text/html; charset=UTF-8" p ...