MySQL高级 索引优化分析

SQL 的效率问题

出现性能下降,SQL 执行慢,执行时间长,等待时间长等情况,可能的原因有:

  • 查询语句写的不好
  • 索引失效
    • 单值索引:在 user 表中给 name 属性建索引 create index idx_user_name on user(name);
    • 复合索引:在 user 表中给 name、email 属性索引
  • 由于设计缺陷或业务需求,导致关联查询太多表连接
  • 配置文件参数设置以及调优影响

常见的连接查询

SQL 执行顺序

书写的 SQL 语句顺序:

select distinct <select_list>
from <left_table> <join_type>
join <right_table>
on <join_condition>
where <where_condition>
group by <group_by_list>
having <having_condition>
order by <order_by_condition>
limit <limit_number>

实际的 SQL 执行顺序(常见的):

from <left_table>
on <join_condition>
<join_type> join <right_table>
where <where_condition>
group by <group_by_list>
having <having_condition>
select distinct <select_list>
order by <order_by_condition>
limit <limit_number>

总结可知,实际的执行顺序是从 form 开始执行的。可以有下图形象表示:

连接查询

对于多表连接的问题,一张图就够了。left join 意思是左边的全保留,如果左边的和右边的不符合 on 的条件,那么左边对应右边的列自动为 nullright join 同理。

建表测试

create database MySQLTest;

use MySQLTest;

drop table if exists tbl_dept;
CREATE TABLE tbl_dept(
id INT(11) NOT NULL AUTO_INCREMENT,
deptName VARCHAR(30) DEFAULT NULL,
locAdd VARCHAR(40) DEFAULT NULL,
PRIMARY KEY(id)
)ENGINE=INNODB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8; drop table if exists tbl_emp;
CREATE TABLE tbl_emp (
id INT(11) NOT NULL AUTO_INCREMENT,
NAME VARCHAR(20) DEFAULT NULL,
deptId INT(11) DEFAULT NULL,
PRIMARY KEY (id),
KEY fk_dept_Id (deptId)
#CONSTRAINT 'fk_dept_Id' foreign key ('deptId') references 'tbl_dept'('Id')
)ENGINE=INNODB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8; INSERT INTO tbl_dept(deptName,locAdd) VALUES('RD',11);
INSERT INTO tbl_dept(deptName,locAdd) VALUES('HR',12);
INSERT INTO tbl_dept(deptName,locAdd) VALUES('MK',13);
INSERT INTO tbl_dept(deptName,locAdd) VALUES('MIS',14);
INSERT INTO tbl_dept(deptName,locAdd) VALUES('FD',15); INSERT INTO tbl_emp(NAME,deptId) VALUES('z3',1);
INSERT INTO tbl_emp(NAME,deptId) VALUES('z4',1);
INSERT INTO tbl_emp(NAME,deptId) VALUES('z5',1);
INSERT INTO tbl_emp(NAME,deptId) VALUES('w5',2);
INSERT INTO tbl_emp(NAME,deptId) VALUES('w6',2);
INSERT INTO tbl_emp(NAME,deptId) VALUES('s7',3);
INSERT INTO tbl_emp(NAME,deptId) VALUES('s8',4);
INSERT INTO tbl_emp(NAME,deptId) VALUES('s9',51);

笛卡尔积

tbl_emp 表和 tbl_dept 表的笛卡尔乘积:

select * from tbl_emp, tbl_dept;

可以得知结果集个数为 5 * 8 = 40

inner join

tbl_emp 表 和 tbl_dept 表的公共部分(交集):

select * from tbl_emp e inner join tbl_dept d on e.deptId = d.id;

left join

tbl_emp 表和 tbl_dept 表的 公共部分 加上 tbl_emp 表的独有部分:

select * from tbl_emp e left join tbl_dept d on e.deptId = d.id;

left join without common part

tbl_emp 表的独有部分:

select * from tbl_emp e left join tbl_dept d on d.deptId = d.id where d.id is null;

right join

tbl_emp 表和 tbl_dept 表的 公共部分 加上 tbl_dept 表的独有部分:

select * from tbl_emp e right join tbl_dept d on e.deptId = d.id;

right join without common part

tbl_dept 表的独有部分:

select * from tbl_emp e right join tbl_dept d on d.deptId = d.id where e.id is null;

full join

遗憾的是,MySQL 不支持 full join ,但是可以通过 left join union 联合 right join 实现。

union 用于连接结果集,并且自动去重。

tbl_emp 表和 tbl_dept 表的 公共部分 加上 tbl_emp 表的独有部分 加上 tbl_dept 表的独有部分:

select * from tbl_emp e left join tbl_dept d on e.deptId = d.id
union
select * from tbl_emp e right join tbl_dept d on e.deptId = d.id;

full join without common part

tbl_emp 表的独有部分 加上 tbl_dept 表的独有部分:

select * from tbl_emp e left join tbl_dept d on e.deptId = d.id where d.id is null
union
select * from tbl_emp e right join tbl_dept d on e.deptId = d.id; where e.od id null;

索引简介

索引概念

  • 索引是一种用于快速查询和检索数据的数据结构,需要占据物理空间,它们包含着对数据表所有记录的引用指针。常见的索引结构有: B树B+树Hash
  • 平时所说的索引,如果没有特别指明,都是指 B树 结构的索引。
  • 聚集索引、次要索引、覆盖索引、复合索引、前缀索引、唯一索引默认都是使用 B+树 结构的索引,统称索引。
  • 通俗的讲,索引就相当于书的目录,为了方便查找书中的内容,可以通过对内容建立索引形成目录。

索引原理

  • 除了数据之外,数据库还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用或者指向数据,这样就可以在这些数据结构上实现高级查找算法,加快执行速度。这里的数据结构就是我们常说的索引。

  • 一种可能的索引形式,如下图:

    • 左边是数据表,表的最左边的十六进制数字是数据记录的物理位置。

    • 为了加快 Col2 的查找,可以维护一个右边所示的二叉查找树,每个节点分别包含着索引键值和一个指向对应数据记录物理地址的指针,这样就可以运用 二叉查找 在一定的复杂度内获取到相应数据,从而快速的检索出符合条件的记录。

索引优缺点

  • 优点

    • 可以提高数据检索效率,降低数据库的 IO 成本。
    • 可以降低数据排序成本,降低 CPU 的消耗。
  • 缺点
    • 索引实际上是一张表,它保存了主键和索引字段,并指向实体表。它也是需要占据物理空间的。
    • 会降低更新表的速度,对表进行增删改操作,MySQL 不仅要保存数据,而且还有更新索引。
    • 对于大数据量的表,建立良好的索引是比较困难的。

索引分类

  • 普通索引:最基本的索引类型,没有什么特别的限制。

    • ALTER TABLE table_name ADD INDEX index_name (column(length)); 创建普通索引
    • ALTER TABLE table_name ADD INDEX index_name (column1(length), colimn2(length)); 创建普通组合索引
  • 唯一索引:数据列不能重复,能为 NULL,一个表可以有多个唯一索引。
    • ALTER TABLE table_name ADD UNIQUE (column(length)); 创建唯一索引
    • ALTER TABLE table_name ADD UNIQUE (column1(length), column2(length)); 创建唯一组合索引
  • 主键索引:数据列不能重复,不能为 NULL,一个表只能有一个主键索引。
    • ALTER TABLE table_name ADD PRIMARY KEY (column(length)); 创建主键索引
  • 组合索引
    • ALTER TABLE table_name ADD INDEX index_title_time (title(length), time(length)); 创建组合索引
    • 这个组合索引,相当于 title, timetitle 两种索引。
    • 为什么没有 time 这个索引呢?这是因为 MySQL 组合索引 最左前缀的规则 ,即 只从最左面的开始组合,并不是只要包含这两列的查询都会用到该组合索引
  • 全文索引:目前搜索引擎关键的技术,MyISAM 支持,InnoDB 不支持。
    • ALTER TABLE table_name ADD FULLTEXT (column(length)); 创建全文索引

索引使用

  • 创建索引

    • 如果是 CHAR 和 VARCHAR 类型,length 可以小于字段实际长度。
    • 如果是 BLOB 和 TEXT 类型,必须指定 length。
    • 直接创建 create index_type [index_name] on table(column_name(length))
    • 修改表结构创建 alter table table_name add index_type [index_name] (column_name)
    • 创建表时同时创建 create table xx (index_type [index_name] (column_name(length)))
  • 删除索引:
    • 直接删除 drop index 索引名 on 表名
    • 改表结构删除 alter table 表名 drop index 索引名
  • 查看索引:
    • EXPLAIN select * from index_demo d where d.e_name = 'Jane'; 查看 SQL 语句对索引的使用情况
    • show index from 表名; 查看已创建的索引

索引结构

B 树

B+ 树

索引使用时机

性能分析

索引优化

总结和练习

【MySQL 高级】索引优化分析的更多相关文章

  1. MySQL的索引优化分析(一)

    一.SQL分析 性能下降.SQL慢.执行时间长.等待时间长 查询语句写的差 索引失效关联查询太多join(设计缺陷) 单值索引:在user表中给name属性创建索引,create index idx_ ...

  2. MySQL的索引优化分析(二)

    一.索引优化 1,单表索引优化 建表 CREATE TABLE IF NOT EXISTS article( id INT(10) UNSIGNED NOT NULL PRIMARY KEY AUTO ...

  3. MySQL高级-索引优化

    索引失效 1. 2.最佳左前缀法则 4. 8. 使用覆盖索引解决这个问题. 二.索引优化 1.ORDER BY 子句,尽量使用Index方式排序,避免使用FileSort方式排序 MySQL支持两种方 ...

  4. 【mysql】索引优化分析

    1. 索引的概念 1.1 索引是什么 MySQL 官方对索引的定义为:索引(Index)是帮助MySQL 高效获取数据的数据结构.可以得到索引的本质:索引是数据结构.可以简单理解为排好序的快速查找数据 ...

  5. Mysql 索引优化分析

    MySQL索引优化分析 为什么你写的sql查询慢?为什么你建的索引常失效?通过本章内容,你将学会MySQL性能下降的原因,索引的简介,索引创建的原则,explain命令的使用,以及explain输出字 ...

  6. mySql索引优化分析

    MySQL索引优化分析 为什么你写的sql查询慢?为什么你建的索引常失效?通过本章内容,你将学会MySQL性能下降的原因,索引的简介,索引创建的原则,explain命令的使用,以及explain输出字 ...

  7. 知识点:Mysql 数据库索引优化实战(4)

    知识点:Mysql 索引原理完全手册(1) 知识点:Mysql 索引原理完全手册(2) 知识点:Mysql 索引优化实战(3) 知识点:Mysql 数据库索引优化实战(4) 一:插入订单 业务逻辑:插 ...

  8. MySQL高级学习笔记(四):索引优化分析

    文章目录 性能下降 SQL慢 执行时间长 等待时间长 查询语句写的烂 查询数据过多 关联了太多的表,太多join 没有利用到索引 单值 复合 服务器调优及各个参数设置(缓冲.线程数等)(不重要DBA的 ...

  9. MySQL高级第二章——索引优化分析

    一.SQL性能下降原因 1.等待时间长?执行时间长? 可能原因: 查询语句写的不行 索引失效(单值索引.复合索引) CREATE INDEX index_user_name ON user(name) ...

随机推荐

  1. js 几种跨域解决方法

    同源策略: JS只能与同一个域中的页面进行通讯,必须是协议.域名.端口都相同,相同域下才能相互通信,这可以被认为是一种通信原则,叫同源策略. 跨域: js跨域是指通过js在不同的域之间进行数据传输或通 ...

  2. Java并发编程的艺术(五)——线程和线程的状态

    线程 什么是线程 操作系统调度的最小单元就是线程,也叫轻量级进程. 为什么要使用多线程 多线程程序能够更有效率地利用多处理器核心. 用户响应时间更快. 方便程序员将程序模型映射到Java提供的多线程编 ...

  3. rsync 参数说明及使用参数笔记好文摘抄

    一.前言 最近发现rsync挺好用的--不过参数有点多,所以这儿写一篇给自己以后要用的时候做个参考. 二.参数说明 这儿全是我翻资料连蒙带猜(有些实在是不好解释)翻译出来的,请各位转载的留个名啊,虽然 ...

  4. 查找列表中的元素,移动空格 并查找以a或A 为开头 并以c 结尾的元素

    li = ['alec',' aric','Alex','Tony','rain']tu = ('alec',' aric','Alex','Tony','rain')dic = { 'k1':'al ...

  5. 漫谈 HTTP 性能优化

    本文主要是侧重于 HTTP 的优化,对于 HTTPS 后续文章会讲. 既然要做性能优化,那么,我们就需要知道:什么是性能?它都有哪些指标,又应该如何度量,进而采取哪些手段去优化? "性能&q ...

  6. postgresql 运行sql文件

    方法一: [postgres@node01 ~]$ psql -Upostgres postgres=# \l List of databases Name | Owner | Encoding | ...

  7. 安装xshell6

    xshell作为一个强大的安全终端模拟软件,深受广大人民喜爱,本文将介绍如何在Windows环境下安装最新版本的xshell客户端. 一,下载 1,打开官网下载链接https://www.netsar ...

  8. C++ 中使用 PRId64

    同一份代码,Ubuntu 14.04.1 编译没有问题,centos 7 上编译提示错误: error: expected ')' before 'PRId64' 这里两个地址说得很清楚了: http ...

  9. C#数据结构-赫夫曼树

    什么是赫夫曼树? 赫夫曼树(Huffman Tree)是指给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小.哈夫曼树(也称为最优二叉树)是带权路径长度最短的树,权值较大的结点 ...

  10. 轻松理解HTTP缓存策略

    上一篇文章我写了koa-static的源码解析,其中用到了HTTP的缓存策略,给返回的静态文件设置了一些缓存的头,比如Cache-Control之类的.于是我就跟朋友讨论了一下HTTP的缓存策略: 朋 ...