MySql设计规范及SQL索引优化【呕心之作】

数据库及表结构基本设计规范

1. 所有表必须使用Innodb存储引擎

没有特殊要求（即Innodb无法满足的功能如：列存储，存储空间数据等）的情况下，所有表必须使用Innodb存储引擎（mysql5.5之前默认使用Myisam，5.6以后默认的为Innodb）。Innodb 支持事务，支持行级锁，更好的恢复性，高并发下性能更好。

2. 优先选择符合存储需要的最小的数据类型

列的字段越大，建立索引时所需要的空间也就越大，索引的性能也越差。

3. 尽可能把所有列定义为NOT NULL

索引NULL列需要额外的空间来保存，所以要占用更多的空间

进行比较和计算时要对NULL值做特别的处理

4. 使用TIMESTAMP（4个字节）或DATETIME类型（8个字节）存储时间

TIMESTAMP 存储的时间范围 1970-01-01 00:00:01 ~ 2038-01-19-03:14:07，TIMESTAMP 占用4字节和INT相同，但比INT可读性高；

超出TIMESTAMP取值范围的使用DATETIME类型存储

　　经常会有人用字符串存储日期型的数据（不正确的做法）

缺点1：无法用日期函数进行计算和比较
缺点2：用字符串存储日期要占用更多的空间

5. 同财务相关的金额类数据必须使用decimal类型

非精准浮点：float,double
精准浮点：decimal

Decimal类型为精准浮点数，在计算时不会丢失精度

占用空间由定义的宽度决定，每4个字节可以存储9位数字，并且小数点要占用一个字节

可用于存储比bigint更大的整型数据

6. 数据库和表的字符集统一使用UTF8

兼容性更好，统一字符集可以避免由于字符集转换产生的乱码；如果有存储emoji表情的需要，采用utf8mb4字符集。

7. 尽量控制单表数据量的大小，建议控制在500万以内。

500万并不是Mysql数据库的限制，过大会造成修改表结构，备份，恢复都会有很大的问题。

可以用历史数据归档（应用于日志数据），分库分表（应用于业务数据）等手段来控制数据量大小

8. 禁止在表中建立预留字段

预留字段的命名很难做到见名识义。预留字段无法确认存储的数据类型，所以无法选择合适的类型。

对预留字段类型的修改，会对表进行锁定。

9. 禁止在数据库中存储图片，文件等大的二进制数据；通常文件存储于文件服务器，数据库只存储文件地址信息

10. 尽量避免使用外键约束（这个各有见解，不强制）

不建议使用外键约束（foreign key），但一定要在表与表之间的关联键上建立索引
外键会影响父表和子表的写操作从而降低性能

SQL优化细节规范：

　　做MySQL优化，我们要善用EXPLAIN查看SQL执行计划。

type列，连接类型。一个好的SQL语句至少要达到range级别。杜绝出现all级别。
key列，使用到的索引名。如果没有选择索引，值是NULL。可以采取强制索引方式。
key_len列，索引长度。
rows列，扫描行数。该值是个预估值。
extra列，详细说明。注意，常见的不太友好的值，如下：Using filesort，Using temporary。

1、当只需要一条数据的时候，使用limit 1，为了使EXPLAIN中type列达到const类型

2.、禁止使用SELECT * 必须使用SELECT <字段列表> 查询；避免消耗更多的CPU和IO以网络带宽资源

3、避免使用JOIN关联太多的表

4、减少同数据库的交互次数

5、使用合理的分页方式以提高分页的效率

　　　　如 select id,name from product limit 800000, 20；替换为 select id,name from product where id> 800000 limit 20；

6、不建议使用%前缀模糊查询

7、对应同一列进行or判断时，使用in代替or

　　in 的值不要超过500个，in 操作可以更有效的利用索引，or大多数情况下很少能利用到索引。很多时候使用union all或者是union（必要的时候）的方式来代替“or”会得到更好的效果。

8、尽量用union all代替union

9、 WHERE从句中禁止对列进行函数转换和计算

　　select user_id,user_project from user_base where age*2=36; 替换为 select user_id,user_project from user_base where age=36/2;

10、避免产生大事务操作

11、在明显不会有重复值时使用UNION ALL 而不是UNION

UNION 会把两个结果集的所有数据放到临时表中后再进行去重操作
UNION ALL 不会再对结果集进行去重操作

索引设计规范

1. 限制每张表上的索引数量，建议单张表索引不超过5个

　　索引并不是越多越好！索引可以提高效率同样可以降低效率。

　　索引过多会增加mysql优化器生成执行计划的时间，同样会降低查询性能。

2. 对于联合索引来说，要遵守最左前缀法则

　　字段长度小、区分度最高及使用最频繁的列放在联合索引的最左侧

3. 避免建立冗余索引和重复索引（增加了查询优化器生成执行计划的时间）

重复索引示例：primary key(id)、index(id)、unique index(id)
冗余索引示例：index(a,b,c)、index(a,b)、index(a)

4. 每个Innodb表必须有个主键

Innodb是按照主键索引的顺序来组织表的

不要使用UUID,MD5,HASH,字符串列作为主键（无法保证数据的顺序增长）
主键建议使用自增ID值

5.常见索引列建议

出现在SELECT、UPDATE、DELETE语句的WHERE从句中的列
包含在ORDER BY、GROUP BY、DISTINCT中的字段
并不要将符合1和2中的字段的列都建立一个索引，通常将1、2中的字段建立联合索引效果更好
多表join的关联列

6、注意范围查询语句

　　对于联合索引来说，如果存在范围查询，比如between、>、<等条件时，会造成后面的索引字段失效。

7、尽量使用inner join，避免left join：利用小表去驱动大表

　　参与联合查询的表至少为2张表，一般都存在大小之分。如果连接方式是inner join，在没有其他过滤条件的情况下MySQL会自动选择小表作为驱动表，但是left join在驱动表的选择上遵循的是左边驱动右边的原则，即left join左边的表名为驱动表。

8、区分in和exists、not in和not exists

关于not in和not exists，推荐使用not exists。更多比较移步：浅析MySQL中exists与in的使用（写的非常好）

参考文章：

sql中索引不会被用到的几种情况

paip.sql索引优化----join 代替子查询法
paip.sql索引优化----join 代替子查询法作者Attilax , EMAIL:1466519819@qq.com 来源:attilax的专栏地址:http://blog.csdn.n ...
SQL索引优化方法
SQL索引优化方法以下是代码片段: ROW_NUMBER() OVER(ORDER BY ResumeCreateTime DESC) as [RowID] ,[TopDegree] ,[Degre ...
MYSQL学习笔记——sql语句优化之索引
上一篇博客讲了可以使用慢查询日志定位耗时sql,使用explain命令查看mysql的执行计划,以及使用profiling工具查看语句执行真正耗时的地方,当定位了耗时之后怎样优化呢?这篇博客会介绍my ...
MySQL慢查询优化、索引优化、以及表等优化总结
MySQL优化概述 MySQL数据库常见的两个瓶颈是:CPU和I/O的瓶颈. CPU在饱和的时候一般发生在数据装入内存或从磁盘上读取数据时候. 磁盘I/O瓶颈发生在装入数据远大于内存容量的时候,如果应 ...
MySQL高级第二章——索引优化分析
一.SQL性能下降原因 1.等待时间长?执行时间长? 可能原因: 查询语句写的不行索引失效(单值索引.复合索引) CREATE INDEX index_user_name ON user(name) ...
阿里P8架构师谈：MySQL慢查询优化、索引优化、以及表等优化总结
更多内容:https://www.toutiao.com/i6599796228886626829/?tt_from=weixin&utm_campaign=client_share& ...
MySQL 5.6.35 索引优化导致的死锁案例解析
一.背景随着公司业务的发展,商品库存从商品中心独立出来成为一个独立的系统,承接主站商品库存校验.订单库存扣减.售后库存释放等业务.在上线之前我们对于核心接口进行了压测,压测过程中出现了 MySQL ...
MySQL调优之索引优化
一.索引基本知识 1.索引的优点 1.减少了服务器需要扫描的数据量 2.帮助服务器避免排序和临时表例子: select * from emp orde by sal desc; 那么执行顺序: 所以 ...
SQL索引优化
序言数据库的优化方法有很多种,在应用层来说,主要是基于索引的优化.本次秘笈根据实际的工作经验,在研发原来已有的方法的基础上,进行了一些扩充,总结了基于索引的SQL语句优化的降龙十八掌,希望有一天你能用 ...

随机推荐

Rundeck概况
1.Rundeck介绍 RunDeck是用Java/Grails写的开源工具,帮助用户在数据中心或者云环境中自动化各种操作和流程.通过命令行或者web界面,用户可以对任意数量的服务器进行操作,大大降低 ...
spark 作业提交
kafka-topics.sh --describe --zookeeper xxxxx:2181 --topic testkafka-run-class.sh kafka.tools.GetOffs ...
使用LinQ进行增删改查
数据库访问技术: ADO.net EF框架 LinQ LinQ是一种高集成化的数据库访问技术,他将数据库中的表映射成程序中的类数据库的表名变成类名数据库的列名变成字段名/属性名所有的操作都是通过 ...
Python的进程、线程和threading模块
(注:本文部分内容摘自互联网,由于作者水平有限,不足之处,还望留言指正.) 怀念在学校念书的时候,我不小心触碰到了错误,老师会说:你错了:而我却总是倔强得以为自己没错.我的内心是不屑的,直到在真理面前 ...
C++之条形码，windows下zint库的编译及应用（一）
zint库是一个开源的第三方库,提供了生成条形码.二维码等功能.本文主要介绍zint库的生成及简单应用. 工具/原料 vs2012 代码文件下载 1 下载zint包 2 zint依赖另外两个库 ...
浅谈boost.variant的几种访问方式
前言 variant类型在C++14并没有加入,在cppreference网站上可以看到该类型将会在C++17加入,若想在不支持C++17的编译器上使用variant类型,我们可以通过boost的va ...
php与js 编码解码交互
javascript: var fontcolorEncode=encodeURIComponent(fontcolor.value); //编码 php: $fontcolordecode= u ...
【c++ primer, 5e】返回类型和return语句
[无返回值函数] 1.在c++的void函数中,可以显式地使用return;语句来提前结束函数的调用. [有返回值函数] 1.值是如何被返回的:返回一个值的方式和初始化一个变量或者形参的方式完全一样. ...
【读书笔记】《深入浅出nodejs》第四章异步编程
1. 异步编程的基础 -- 函数式编程 (1)高阶函数 -- 是可以把函数作为参数,或是将函数作为返回值的函数. (2)偏函数用法 -- 创建一个调用另外一个部分 -- 参数或变量已经预置的函数 -- ...
【前端】Vue.js实现简单价格计算器
价格计算器实现效果: 实现代码及注释: <!DOCTYPE html> <html> <head> <title>价格计算器</title> ...