MySQL的索引知识
一、什么是索引。
索引是用来加速查询的技术的选择之一,在通常情况下,造成查询速度差异 的因素就是索引是否使用得当。当我们没有对数据表的某一字段段或者多个 字段添加索引时,实际上执行的全表扫描操作,效率很低。而如果我们为某 些字段添加索引,mysql
在执行搜索时便可以通过扫描索引,然后再找出索 引对应的值,从而提高效率。
二、索引的类型
实际上索引的类型不多,以下只是针对个人以前遇到的索引概念的解释,有 可能某个索引有多种称呼,只是取决于你用哪个角度去描述它。
B
树索引:采用B-tree
s数据结构存储索引,比如PRIMARY KEY
,UNIQUE
,INDEX
。Hash
索引:将一个散列函数应用于每一个列值,最终的散列值都会被存入索引,用于执行查找。R
树索引:采用R-trees
数据结构存储索引,比如Spatial index
。(空间数据类型的索引)- 全文索引
(FULLTEXT INDEX)
:一般在CHAR
,VARCHAR
或者TEXT
列上创建此索引。可用来代替like ‘%xx%’
实现模糊查询。 - 前缀索引:只对一个列或者多个列的前几个字符或者字节索引。
- 唯一索引:只对一个列创建索引。
- 多列索引:对多个列创建索引。在多列索引中必须注意最左前缀这个原则。比如对于
(col1,col2,col3)
这三列进行索引时,只有(col1)
,(col1,col2)
,(col1,col2,col3)
才能进行索引搜索。
注意(col1,col3)
也不能进行索引。 - 聚簇索引:每个
InnoDB
表都有一个特殊的索引称为聚簇索引,一般来说,当为一个表定义一个PRIMAY KEY
时,InnoDB
就会使用它作为聚簇索引。如果没有定义PRIMARY KEY
时,MySQL
就会查找第一个非空的UNIQUE index
作为聚簇索引。如果以上两种情况都不满足的话,InnoDB
内部会在表的每一行产生一个隐藏的并且名为GEN_CLUST_INDEX
的聚簇索引。这个聚簇索引是一个六个字节
长度的行ID
字段,ID
值随着新行的插入而单调增长。实际上,除了聚簇索引,其他索引都称为二级索引。在InnoDB
中,二级索引的每一行(将索引假设为行方便理解,实际上索引的存储方式取决于具体的存储引擎)中都包含着一个PRIMARY KEY
列,InnoDB
使用PRIMARY KEY
这一列的列值在聚簇索引中查找相对应的数据(可以将聚簇 索引理解为中间值),从而最后得到最终的结果集。聚簇索引的数据分布如下图:(图来自《高性能MySQL》)
上图中,节点页存放是索引(对应着二级索引的PRIMARY KEY
),叶子页存放着所对应的数据,节点页和叶子页这个整体就称为聚簇索引,由此可见,聚簇索引更像是一种数据存储结构。 - 覆盖索引:当查询的结果集可以通过所创建的索引查找出来时,这个索引就称为覆盖索引。
下面举个例子:
对于上面这个表,当执行下面的语句时,就会使用覆盖索引查询。
因为我们在创建表的时候对last_name
、first_name
创建了多列索引,并且在查询的时候只查询这两列的结果,因此MySQL
会使用覆盖索引查询数据,这也意味着MySQL
不会对实际的数据行进行查询,因为所需结果已经可以从索引中查找出来了。
另外可以看一下下面的SQL
语句:
在上面的SQL
语句中,我们想查询id
和last_name
的值,而id
是主键,last_name
是多列索引中的最左索引,但是此时的查询依旧使用覆盖索引查询。原因在于id
实际是作为聚簇索引的,而多列索引自然就是二级索引了,上面提到,二级索引都包含着一列PRIMARY KEY
列,而列值就是聚簇索引的索引值,因此此时MySQL
可以直接使用覆盖索引中查找出对应的结果集。
三、B树索引和Hash索引的比较
InnoDB
存储引擎和MyISAM
存储引擎都只支持B树索引(实际上InnoDB
还支持自适应的hash
索引,只是不能人为创建),MEMORY
存储引擎默认使用hash
索引,但它也支持B
树索引。- 在使用
<
、<=
、=
、>=
、>
、<>
、!=
和BETWEEN
运算符,进行精确比较或者范围比较时,使用B
树索引会带来高效。如果匹配模式是以一个纯字符串,而不是一个通配符作为开头的,那么B
树索引还可以用在使用like
进行模式匹配的操作里。
下面举个例子:
- 对于
hash
索引,在使用运算符=
或者<=>
(安全等于的意思,当比较的值含有null
值的时候,来返回一个布尔值)完成精确(这里说精确是因为hash
索引是用一个hash
函数对整个列值hash
,而不是某几个字符或者字节)匹配的比较操作里,散列索引的速度非常快。
四、索引的挑选
- 一般对于出现在
WHERE
子句中的列、连接子句中的列、或者出现在ORDER BY
或GROUP BY
子句中的列创建索引是比较好的。 - 尽量索引短小值。应尽量选用较小的数据类型。比如值的长度不超过
25
个字符,那么就不要用CHAR(200)
,其他数据类型同理。特别是InnoDB
表来说,因为它使用的是聚簇索引,如果主键过长的话,会导致二级索引占用的存储空间过大。 - 索引字符串值的前缀。当对字符串列进行索引时,应当尽可能指定前缀长度。比如某一个列的前N个字符足够唯一的话,那么就可以不用为整列进行索引。
五、索引的代价
索引确实可以加快检索速度,但是它同时也降低了索引列的插入、删除和更新值的速度,因为写入一个行不仅是写入一个数据行,还要更改索引。表的索引越多,需要做出的更改就越多,平均性能下降得也就越多。并且当所创建的索引过多时,mysql
查询优化器在选择使用哪种索引方案时,也会降低一定的效率。其次,索引也会占用磁盘空间,多个索引会占据更大的空间。与没有索引相比,使用索引很快便达到表的大小极限。
六、创建索引
- 使用
CREATE TABLE
创建索引(index_name可选)
- 使用ALTER TABLE为已有表创建索引(index_name可选)
- 使用CREATE INDEX创建索引(index_name不可省略)
如果某个索引列在索引时使用了PRIMARY KEY
或SPATIAL
,则它必须为NOT NULL
的。其他索引列允许包含NULL
值。
如果想要限制某个索引,让它只包含唯一值,那么可以把这个索引创建为PRIMARY KEY
或UNIQUE
索引。 这两种索引很像,主要区别有一下两点: - 每个表只能包含一个
PRIMARY KEY
。因为PRIMARY KEY
的名字总是为PRIMARY
,而同一个表不允许有两个同名的索引。可以在一个表里放置多个UNIQUE
索引。 PRIMARY KEY
不可以包含NULL
值,而UNIQUE
索引可以。如果某个UNIQUE
索引包含了NULL
值,那么它就可以包含多个NULL
值。因为NULL
值不会与任何值相等,包括它本身。
七、删除索引
最后,我们可以通过DROP INDEX
或ALTER TABLE
语句来删除索引
- 通过DROP INDEX删除索引
- 通过
DROP INDEX
删除索引
八、[PRIMARY|UNIQUE]KEY与[UNIQUE]INDEX的关系
首先来看一下MySQL
创建表的语句:(图来自《MySQL官方文档》,图太大所以省略了一部分)
从上图可以看出,实际上INDEX
和KEY
是同义词,之所以同时存在主要是为了与其他数据库系统做兼容,另外还有以下两个结论。
PRIMARY KEY
与UNIQUE[INDEX|KEY]
很相似,具体区别可以查看上面的内容。INDEX和KEY
允许出现相同的列值,但是UNIQUE[INDEX|KEY]
不允许出现相同的列值。(记住NULL != NULL)
九、参考资料
- MySQL 8.0官方文档
- 《高性能MySQL》第三版
- 《MySQL技术内幕》第五版
- https://stackoverflow.com/questions/707874/differences-between-index-primary-unique-fulltext-in-mysql
MySQL的索引知识的更多相关文章
- MySQL索引知识学习笔记
目录 一.索引的概念 二.索引分类 三.索引用法 四 .索引架构简介 五.索引适用的情况 六.索引不适用的情况 继我的上篇博客:Oracle索引知识学习笔记,再记录一篇MySQL的索引知识学习笔记,本 ...
- MySQL中索引的基础知识
本文是关于MySQL中索引的基础知识.主要讲了索引的意义与原理.创建与删除的操作.并未涉及到索引的数据结构.高性能策略等. 一.概述 1.索引的意义:用于提高数据库检索数据的效率,提高数据库性能. 数 ...
- mysql索引知识简单记录
简介 今天记录下索引基础知识 1.mysql单表最多支持多少个索引,索引总长度为多少? 索引是在存储引擎中实现的,因此每种存储引擎的索引都不一定完全相同,并且每种存储引擎也不一定支持所有索引类型. ...
- 数据库索引知识到MySQL InnoDB
前言 本文聊聊数据库中的索引,涉及索引基础数据结构,分类.以及使用索引的缺点. 索引就像一本书的目录,商场里面各个楼层指示图,让我们不需要自己无目的的找,而是能够很快的找到自己想要的. 1. 索引的基 ...
- MySQL 索引知识总结
将 mysql 的索引以书本的索引类比比较贴切,要找到一个关键字为xxx 的条目,首先翻到索引中查找有哪些页码涉及到,无疑就缩小了范围.在这个小范围内再寻找符合条件的数据,效率就会提高许多. mysq ...
- mysql高性能索引策略
转载说明:http://www.nyankosama.com/2014/12/19/high-performance-index/ 1. 引言 随着互联网时代地到来,各种各样的基于互联网的应用和服务进 ...
- 手把手教你mysql(十)索引
手把手教你mysql(十)索引 一:索引的引入 索引定义:索引是由数据库表中一列或者多列组合而成,其作用是提高对表中数据的查询速度. 类似于图书的目录,方便快速定位,寻找指定的内容,如一本1000页的 ...
- B+Tree原理及mysql的索引分析
一.索引的本质 MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构.提取句子主干,就可以得到索引的本质:索引是数据结构. 我们知道,数据库查询是数据库的最主要功能之 ...
- MySQL学习----索引的使用
一.什么是索引?为什么要建立索引? 索引用于快速找出在某个列中有一特定值的行,不使用索引,MySQL必须从第一条记录开始读完整个表,直到找出相关的行,表越大,查询数据所花费的时间就越多,如果表中查询的 ...
随机推荐
- 阿里云物联网 .NET Core 客户端 | CZGL.AliIoTClient:9. 自定义委托事件方法
文档目录: 说明 1. 连接阿里云物联网 2. IoT 客户端 3. 订阅Topic与响应Topic 4. 设备上报属性 4.1 上报位置信息 5. 设置设备属性 6. 设备事件上报 7. 服务调用 ...
- 端口渗透·网站渗透过程 --21 ,22,873,3306,6379,8080(8080端口是针对CMS的渗透)
声明:文章渗透网站为模拟环境,文章只为利用过程 文章为信息收集和端口渗透两部分,21端口为ftp版本漏洞 8080端口为CMS的渗透 信息收集: ·使用扫描工具nmap ,PortScan 对整个网段 ...
- ADO学途 two day
代码实现的参照性在学习程序中占了关键比重,最基本的都一直无法运行成功,那就无法深入 研究.实现winfrom功能的要点之一实践中获取原理:不清楚代码的一些原理,即使copy过来,大多也 存无法运行的情 ...
- Ibatis相关
XML中的#和$的区别 http://shenzhenchufa.blog.51cto.com/730213/254561 poolMaximumActiveConnections和poolMaxim ...
- UVa12304(计算几何中圆的基本操作)
断断续续写了250多行的模拟,其间被其他事情打扰,总共花了一天才AC吧~ 这道题目再次让我明白,有些事情看起来很难,实际上并没有我们想象中的那么难.当然了我主要指的不是这个题的难度…… 也是初学计算几 ...
- 【aspnetcore】使用TagHelper制作分页组件
自定义TageHelper并不难,只要记住几个点: 继承TagHelper 定义需要在TagHelper中传入的参数,如果不需要参数,可忽略 重写Process方法 在Process中拼接要输出的HT ...
- 安装好的php独立添加扩展模块
在装好php后,或者在使用php的时候,发现某个模块没有添加,而又不想重新编译安装,这时就需要单独添加扩展模块. php环境说明: 安装路径:/data/php5.6/ 解压路径:/data/php- ...
- Springboot日志配置探索(主要看logback)(一)
这篇博客是springboot日志配置探索的第一篇,主要讲默认配置下springboot的logback日志框架的配置(即直接使用是怎样的) 首先,是一个SpringBoot的有关日志的说明文档:ht ...
- Django 使用Paginator分页
from django.core.paginator import Paginator, EmptyPage, PageNotAnInteger subclass_s = models.subclas ...
- python学习之IO:
输入输出兼程IO操作,有同步(速度不匹配时四等)和异步(轮询和消息通知,复杂而高效) 一 文件操作函数: 文件打开:f=open("文件路径“,“操作类型 r/rb/w/a”,"编 ...