SQL 规范性检查

select 检查

UDF 用户自定义函数

SQL 语句的 select 后面使用了自定义函数 UDF，SQL 返回多少行，那么 UDF 函数就会被调用多少次，这是非常影响性能的。

#getOrderNo 是用户自定义一个函数用户来根据 order_sn 来获取订单编号

select id, payment_id, order_sn, getOrderNo(order_sn) from payment_transaction where status = 1 and create_time between '2020-10-01 10:00:00' and '2020-10-02 10:00:00';

text 类型检查

如果 select 出现 text 类型的字段，就会消耗大量的网络和 IO 带宽，由于返回的内容过大超过 max_allowed_packet 设置会导致程序报错，需要评估谨慎使用。

#表 request_log 的中 content 是 text 类型。

select user_id, content, status, url, type from request_log where user_id = 32121;

group_concat 谨慎使用

gorup_concat 是一个字符串聚合函数，会影响 SQL 的响应时间，如果返回的值过大超过了 max_allowed_packet 设置会导致程序报错。

select batch_id, group_concat(name) from buffer_batch where status = 0 and create_time between '2020-10-01 10:00:00' and '2020-10-02 10:00:00';

内联子查询

在 select 后面有子查询的情况称为内联子查询，SQL 返回多少行，子查询就需要执行过多少次，严重影响 SQL 性能。

select id,(select rule_name from member_rule limit 1) as rule_name, member_id, member_type, member_name, status

from member_info m where status = 1 and create_time between '2020-09-02 10:00:00' and '2020-10-01 10:00:00';

from 检查

表的链接方式

在 MySQL 中不建议使用 Left Join，即使 ON 过滤条件列索引，一些情况也不会走索引，导致大量的数据行被扫描，SQL 性能变得很差，同时要清楚 ON 和 Where 的区别。

SELECT a.member_id,a.create_time,b.active_time

FROM operation_log a LEFT JOIN member_info b ON a.member_id = b.member_id where  b.`status` = 1

and a.create_time between '2020-10-01 00:00:00' and '2020-10-30 00:00:00' limit 100, 0;

子查询

由于 MySQL 的基于成本的优化器 CBO 对子查询的处理能力比较弱，不建议使用子查询，可以改写成 Inner Join。

select b.member_id,b.member_type, a.create_time,a.device_model

from member_operation_log a inner join (select member_id,member_type from member_base_info where `status` = 1

and create_time between '2020-10-01 00:00:00' and '2020-10-30 00:00:00') as b on a.member_id = b.member_id;

where 检查

索引列被运算

当一个字段被索引，同时出现 where 条件后面，是不能进行任何运算，会导致索引失效。

#device_no 列上有索引，由于使用了 ltrim 函数导致索引失效

select id, name , phone, address, device_no from users where ltrim(device_no) = 'Hfs1212121';

#balance 列有索引,由于做了运算导致索引失效

select account_no, balance from accounts where balance + 100 = 10000 and status = 1;

类型转换

对于 Int 类型的字段，传 varchar 类型的值是可以走索引，MySQL 内部自动做了隐式类型转换；相反对于varchar 类型字段传入 Int 值是无法走索引的，应该做到对应的字段类型传对应的值总是对的。

#user_id 是 bigint 类型，传入 varchar 值发生了隐式类型转换，可以走索引。

select id, name , phone, address, device_no from users where user_id = '23126';

#card_no 是 varchar(20)，传入 int 值是无法走索引

select id, name , phone, address, device_no from users where card_no = 2312612121;

列字符集

从 MySQL 5.6 开始建议所有对象字符集应该使用用 utf8mb4，包括 MySQL 实例字符集，数据库字符集，表字符集，列字符集。避免在关联查询 Join 时字段字符集不匹配导致索引失效，同时目前只有 utf8mb4 支持 emoji 表情存储。

character_set_server  =  utf8mb4    #数据库实例字符集

character_set_connection = utf8mb4  #连接字符集

character_set_database = utf8mb4    #数据库字符集

character_set_results = utf8mb4     #结果集字符集

group by 检查

前缀索引

group by 后面的列有索引，索引可以消除排序带来的 CPU 开销，如果是前缀索引，是不能消除排序的。

#device_no字段类型varchar(200)，创建了前缀索引。

mysql> alter table users add index idx_device_no(device_no(64));

mysql> select device_no, count(*) from users where create_time between '2020-10-01 00:00:00' and '2020-10-30 00:00:00' group by device_no;

函数运算

假设需要统计某月每天的新增用户量，参考如下 SQL 语句，虽然可以走 create_time 的索引，但是不能消除排序，可以考虑冗余一个字段 stats_date date 类型来解决这种问题。

select DATE_FORMAT(create_time, '%Y-%m-%d'), count(*) from users where create_time between '2020-09-01 00:00:00' and '2020-09-30 23:59:59'

group by DATE_FORMAT(create_time, '%Y-%m-%d')；

order by 检查

前缀索引

order by 后面的列有索引，索引可以消除排序带来的 CPU 开销，如果是前缀索引，是不能消除排序的。

字段顺序

排序字段顺序，asc/desc 升降要跟索引保持一致，充分利用索引的有序性来消除排序带来的 CPU 开销。

limit 检查

limit m,n 要慎重

对于 limit m, n 分页查询，越往后面翻页即 m 越大的情况下 SQL 的耗时会越来越长，对于这种应该先取出主键 id，然后通过主键 id 跟原表进行 Join 关联查询。

表结构检查

表 & 列名关键字

在数据库设计建模阶段，对表名及字段名设置要合理，不能使用 MySQL 的关键字，如 desc, order, status, group 等。同时建议设置 lower_case_table_names = 1 表名不区分大小写。

表存储引擎

对于 OLTP 业务系统，建议使用 InnoDB 引擎获取更好的性能，可以通过参数 default_storage_engine 控制。

AUTO_INCREMENT 属性

建表的时候主键 id 带有 AUTO_INCREMENT 属性，而且 AUTO_INCREMENT=1，在 InnoDB 内部是通过一个系统全局变量 dict_sys.row_id 来计数，row_id 是一个 8 字节的 bigint unsigned，InnoDB 在设计时只给 row_id 保留了 6 个字节的长度，这样 row_id 取值范围就是 0 到 2^48 - 1，如果 id 的值达到了最大值，下一个值就从 0 开始继续循环递增，在代码中禁止指定主键 id 值插入。

#新插入的id值会从10001开始，这是不对的，应该从1开始。

create table booking( `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键id',......) engine = InnoDB auto_increment = 10000;

#指定了id值插入，后续自增就会从该值开始+1，索引禁止指定id值插入。

insert into booking(id, book_sn) values(1234551121, 'N12121');

NOT NULL 属性

根据业务含义，尽量将字段都添加上 NOT NULL DEFAULT VALUE 属性，如果列值存储了大量的 NULL，会影响索引的稳定性。

DEFAULT 属性

在创建表的时候，建议每个字段尽量都有默认值，禁止 DEFAULT NULL，而是对字段类型填充响应的默认值。

COMMENT 属性

字段的备注要能明确该字段的作用，尤其是某些表示状态的字段，要显式的写出该字段所有可能的状态数值以及该数值的含义。

TEXT 类型

不建议使用 Text 数据类型，一方面由于传输大量的数据包可能会超过 max_allowed_packet 设置导致程序报错，另一方面表上的 DML 操作都会变的很慢，建议采用 es 或者对象存储 OSS 来存储和检索。

索引检查

索引属性

索引基数指的是被索引的列唯一值的个数，唯一值越多接近表的 count (*) 说明索引的选择率越高，通过索引扫描的行数就越少，性能就越高，例如主键 id 的选择率是 100%，在 MySQL 中尽量所有的 update 都使用主键 id 去更新，因为 id 是聚集索引存储着整行数据，不需要回表，性能是最高的。

mysql> select count(*) from member_info;

+----------+

| count(*) |

+----------+

|   148416 |

+----------+

1 row in set (0.35 sec)

mysql> show index from member_base_info;

+------------------+------------+----------------------------+--------------+-------------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

| Table            | Non_unique | Key_name                   | Seq_in_index | Column_name       | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |

+------------------+------------+----------------------------+--------------+-------------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

| member_info |          0 | PRIMARY                    |            1 | id                | A         |      131088 | NULL     | NULL   |      | BTREE      |         |               |

| member_info |          0 | uk_member_id               |            1 | member_id         | A         |      131824 | NULL     | NULL   |      | BTREE      |         |               |

| member_info |          1 | idx_create_time            |            1 | create_time       | A         |        6770 | NULL     | NULL   |      | BTREE      |         |               |

+------------------+------------+----------------------------+--------------+-------------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

#Table：表名

#Non_unique ：是否为unique index，0-是，1-否。

#Key_name：索引名称

#Seq_in_index：索引中的顺序号，单列索引-都是1；复合索引-根据索引列的顺序从1开始递增。

#Column_name：索引的列名

#Collation：排序顺序，如果没有指定asc/desc，默认都是升序ASC。

#Cardinality：索引基数-索引列唯一值的个数。

#sub_part：前缀索引的长度；例如index (member_name(10)，长度就是10。

#Packed：索引的组织方式，默认是NULL。

#Null：YES:索引列包含Null值；'':索引不包含Null值。

#Index_type：默认是BTREE，其他的值FULLTEXT，HASH，RTREE。

#Comment：在索引列中没有被描述的信息，例如索引被禁用。

#Index_comment：创建索引时的备注。

前缀索引

对于变长字符串类型 varchar (m)，为了减少 key_len，可以考虑创建前缀索引，但是前缀索引不能消除 group by， order by 带来排序开销。如果字段的实际最大值比 m 小很多，建议缩小字段长度。

alter table member_info add index idx_member_name_part(member_name(10));

复合索引顺序

有很多人喜欢在创建复合索引的时候，总以为前导列一定是唯一值多的列，例如索引 index idx_create_time_status (create_time, status)，这个索引往往是无法命中，因为扫描的 IO 次数太多，总体的 cost 的比全表扫描还大，CBO 最终的选择是走 full table scan。

MySQL 遵循的是索引最左匹配原则，对于复合索引，从左到右依次扫描索引列，到遇到第一个范围查询（>=, >,<, <=, between ….. and ….）就停止扫描，索引正确的索引顺序应该是 index idx_status_create_time (status, create_time)。

select account_no, balance from accounts where status = 1 and create_time between '2020-09-01 00:00:00' and '2020-09-30 23:59:59';

时间列索引

对于默认字段 created_at (create_time)、updated_at (update_time) 这种默认就应该创建索引，这一般来说是默认的规则。

sql优化分三个方向的更多相关文章

SQL优化（三）—— 索引、explain分析
SQL优化(三)—— 索引.explain分析一.什么是索引索引是一种排好序的快速查找的数据结构,它帮助数据库高效的查询数据在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据 ...
oracle存储过程及sql优化-（三）
接下来介绍上篇接触到的存储过程中的sql语句 insert into TMP_GT3_sbfgl_WJSTJB SELECT NSR.NSRSBH, NSR.NSRMC, NSR.SCJYDZ, ca ...
sql优化分字段统计查询
select count(1) from pd_xxx_origin_xxx_data where create_time like '2019-02-23%' and source='20036' ...
SQL优化策略
mysql添加索引 1.主键索引LATER TABLE 'table_neme' ADD PRIMARY KEY('column');2.唯一索引unique空串(null)可以放多个如果是具体的内 ...
系统优化怎么做-SQL优化
大家好,这里是「聊聊系统优化」,并在下列地址同步更新博客园:http://www.cnblogs.com/changsong/ 知乎专栏:https://zhuanlan.zhihu.com/yo ...
mysql优化（三）–explain分析sql语句执行效率
mysql优化(三)–explain分析sql语句执行效率 mushu 发布于 11个月前 (06-04) 分类:Mysql 阅读(651) 评论(0) Explain命令在解决数据库性能上是第一推荐 ...
SQL语法集锦三：合并列值与分拆列值
本文转载http://www.cnblogs.com/lxblog/archive/2012/09/29/2708724.html 在SQL中分拆列值和合并列值老生常谈了,从网上搜刮了一下并记录下来, ...
梁敬彬老师的《收获，不止SQL优化》，关于如何缩短SQL调优时间，给出了三个步骤，
梁敬彬老师的<收获,不止SQL优化>,关于如何缩短SQL调优时间,给出了三个步骤, 1. 先获取有助调优的数据库整体信息 2. 快速获取SQL运行台前信息 3. 快速获取SQL关联幕后信息 ...
SQL 优化总结（三） SQL子句
SQL子句尽可能编写优化器可以优化的语句. 1. SELECT子句 (1) 在查询Select语句中用Where字句限制返回的行数,避免表扫描,如果返回不必要的数据,浪费了服务器的I/O资源,加重了 ...
SQL优化系列（三）- 用最少的索引获得最大的性能提升
从全局出发优化索引对于高负载的数据库,如何创建最少的索引,让数据库的整体性能提高呢?例如,对于100 条SQL语句,如何创建最佳的5条索引? SQL自动优化工具SQL Tuning Expert P ...

随机推荐

查看Sql数据库连接数
select count(1) as nums, sd.name from [Master].[dbo].[SYSPROCESSES] spinner join [Master].[dbo].[SY ...
sqlalchemy 数据类型
ubuntu启动盘制作
转自https://www.cnblogs.com/silentdoer/p/13044305.html 1. 从Ubuntu官网http://cn.ubuntu.com/download/下载系统的 ...
SQL应用系列
载自:https://www.cnblogs.com/downmoon/archive/2011/03/10/1980172.html
IPC，进程间通信
信号机制也叫软中断,软件层次上对中断的模拟 kill -9 加进程号可以终止进程 linux下执行kill -l可以看到这里面居然没有32 33 直接从31到34 所以一共是62个信号 1) SI ...
SPI接口（续三）
在SPI接口中,判断传输的数据位上电平的高低是通过时钟来衡量的,根据时钟的上升沿/下降沿和数据电平的保持/更改,可以组合出4种方式,具体如下图所示. 从上图中可以看出,时钟相位CPHA决定传输的数据电 ...
87、linux root 密码忘记了
子账户登录,然后重置即可
VUE学习-生命周期
生命周期函数描述 beforeCreate 在实例初始化之后,数据观测 (data observer) 和 event/watcher 事件配置之前被调用. created 在实例创建完成后被立即 ...
JS数组的交集与差集
有两个数组arr1,arr2 实现arr2中去除arr1相同的元素 e.g arr1=[1,2,3] arr2=[2,3,4] ===> result = [4] 实现获取两个数组(arr1, ...
Godot从编辑器创建自定义场景类型对象
Godot的编辑器提供了强大的所见即所得功能,并且,我们可以在不从源码编译的情况下,为编辑器提供新的节点类型. 首先,我们创建一个新场景,然后添加一个Node2D,然后为当前节点(Node2D)添加一 ...

sql优化分三个方向

SQL 规范性检查

select 检查

UDF 用户自定义函数

text 类型检查

group_concat 谨慎使用

内联子查询

from 检查

表的链接方式

子查询

where 检查

索引列被运算

类型转换

列字符集

group by 检查

前缀索引

函数运算

order by 检查

前缀索引

字段顺序

limit 检查

limit m,n 要慎重

表结构检查

表 & 列名关键字

表存储引擎

AUTO_INCREMENT 属性

NOT NULL 属性

DEFAULT 属性

COMMENT 属性

TEXT 类型

索引检查

索引属性

前缀索引

复合索引顺序

时间列索引

sql优化分三个方向的更多相关文章

随机推荐

热门专题