1、索引是什么

索引(Index)是帮助MySQL高效获取数据的数据结构。我们可以简单理解为:索引的目的在于提高查询效率。

2、原理

索引的数据结构是B+树,原理图如下

关于B+树的详细介绍,可以参见文章下面的参考。

精简描述:B+树是为了磁盘或其他直接存储辅助设备设计的一种平衡查找树。在B+树中,所有记录节点都是按键值的大小顺序存放在叶子节点上,各叶子节点直接由指针进行连接。

B+树中的B不是代表二叉(binary),而是代表平衡(balance),因为B+树是从最早的平衡二叉树演化而来,但是B+树不是一个二叉树。

索引的内部也是一张表,索引组织表,索引的构建需要使用到磁盘空间跟内存空间,并不是索引越多越好,太多反而导致性能下降,建议一张表最多不要超过8个索引。

3、索引分类

下面的分类维度没有标准,但一般索引我们会比较关注聚集索引跟非聚集索引。

3.1 聚集索引

聚集索引(clustered index)是按照每张表的主键构造一棵B+树,同时叶子节点中存放的即为整张表的行记录数据,也将聚集索引的叶子节点称为数据页。

由于实际的数据页只能按照一棵B+树进行排序,因此每张表只能拥有一个聚集索引。

主键是一个聚集索引,如果在InnoDB没有定义主键,那么默认生成一个rowId作为聚集索引。

3.2 非聚集索引

非聚集索引(Secondary Index,也称辅助索引),叶子节点并不包含行记录的全部数据。叶子节点除了包含键值以外,每个叶子节点中的索引行中还包含了一个书签(bookmark)。该书签用来告诉InnoDB存储引擎哪里可以找到与索引相对应的行数据。

当通过辅助索引来寻找数据时,InnoDB存储引擎会遍历辅助索引并通过叶级别的指针获得指向主键索引的主键,然后再通过主键索引来找到一个完整的行记录。

3.3 覆盖索引

从辅助索引中就可以得到查询的记录,而不需要查询聚集索引中的记录。

使用覆盖索引的好处是辅助索引不包括整行记录中的所有信息,可以减少IO操作。

3.4 唯一索引

不允许具有索引值相同的行,从而禁止重复的索引或键值。

3.5 联合索引

联合索引是指对表上的多个列进行索引。从本质上来说,联合索引也是一颗B+树,不同的是联合索引的键值的数量不是1,而是大于等于2。

索引匹配的原则是最左匹配原则,MySQL会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配。

如建立了索引(a,b,c),那么这些条件语句是可以走到这个索引的,“a=1 and b = 2 and c > 3”、“a=1 and b = 2”,但“b > 1 and d = 10”就没有走到这个索引了,第一个命中的必须是“a”。

4、索引的使用

4.1 选择性:

count(distinct colname)/count(colname) ->1,尽量将选择性高的列放在索引的最前面,但是也存在例外情况。

典型的例子如性别,一般是不建索引的。

4.2 避免Null:

额外存储,特殊处理;

使索引统计和值更加复杂;

SQL执行结果不符合预期

4.3 索引上不要做运算

select id,value from tab where id+10=15 (x)

4.4 多使用联合索引:

将多个字段建立一个组合索引

一个索引可以被多个query利用

减少索引数量,消除重复索引

4.5 避免负向查询

避免使用NOT、!=、<>、!<、!>、NOT EXISTS、NOT IN、NOT LIKE等

5、索引优化

5.1 explain

使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈。

一般重点看type、key、rows。

type:表示表的连接类型。常用的类型有: ALL、index、range、 ref、eq_ref、const、system、NULL(从左到右,性能从差到好)

key:表示实际使用的索引

rows:扫描出的行数(估算的行数),一般这个值越小越好

5.2 Cardinality值

索引是否具有高选择性,一般就可以看Cardinality值。

可以通过“SHOW INDEX FROM table”结果中的列Cardinality来观察,这是一个预估的值,而不是一个准确的值,是通过采样得到的数据。

Cardinality/总条数越接近1,越有必要建索引。

5.3 MySQL查询优化器

MySQL 查询优化器的主要功能是完成SELECT语句的执行,在保证SELECT语句正确执行之外,还有一个重要的功能,就是使用关系代数、启发式规则、代价估值模型等不同种类的技术,提高SELECT语句的执行效率。

这部分是MySQL实现的,可以让我们的SQL写得更“随意”。

参考资料

官方文档mysql-index https://dev.mysql.com/doc/refman/5.6/en/mysql-indexes.html

官方文档聚集索引与辅助索引 https://dev.mysql.com/doc/refman/5.6/en/innodb-index-types.html

姜承饶 《MySQL技术内幕:InnoDB存储引擎》

MySQL索引原理及慢查询优化 https://tech.meituan.com/2014/06/30/mysql-index.html

深入理解什么是B+树 https://cloud.tencent.com/developer/article/1425602

BTree和B+Tree详解 https://www.cnblogs.com/vianzhang/p/7922426.html

Hollis关于Explain的讲解 https://mp.weixin.qq.com/s/OpS_F5lG9CaFw4xqnofWLw

MySQL查询优化器 https://yq.aliyun.com/articles/680912

谈谈MySQL 索引的更多相关文章

  1. 谈谈MySql索引

    刚刚学习完丁奇老师<MySql 实战 45 讲>专栏中的索引部分,图文并茂的风格解开了我之前的许多疑惑,并且学习到许多新的东西,在此做个笔记,方便后续复习.由于 MySql 中存在多种存储 ...

  2. 谈谈MySQL的索引

    目录 索引 前言 是什么 B树 B+树 B树和B+树结构上异同 有什么用 怎么用 索引 前言 总所周知,数据库查询是数据库的最主要功能之一.我们都希望查询数据的速度能尽可能的快.而支撑这一快速的背后就 ...

  3. 谈谈MySQL数据表的类型(转)

    谈谈MySQL数据表的类型 通常意义上,数据库也就是数据的集合,具体到计算机上数据库可以是存储器上一些文件的集合或者一些内存数据的集合. 我们通常说的MySql数据库,sql server数据库等等其 ...

  4. 谈谈MySQL支持的事务隔离级别,以及悲观锁和乐观锁的原理和应用场景?

    在日常开发中,尤其是业务开发,少不了利用 Java 对数据库进行基本的增删改查等数据操作,这也是 Java 工程师的必备技能之一.做好数据操作,不仅仅需要对 Java 语言相关框架的掌握,更需要对各种 ...

  5. 浅谈Mysql索引

    文章原创于公众号:程序猿周先森.本平台不定时更新,喜欢我的文章,欢迎关注我的微信公众号. 我们都知道,数据库索引可以帮助我们更加快速的找出符合的数据,但是如果不使用索引,Mysql则会从第一条开始查询 ...

  6. 索引很难么?带你从头到尾捋一遍MySQL索引结构,不信你学不会!

    前言 Hello我又来了,快年底了,作为一个有抱负的码农,我想给自己攒一个年终总结.自上上篇写了手动搭建Redis集群和MySQL主从同步(非Docker)和上篇写了动手实现MySQL读写分离and故 ...

  7. 带你从头到尾捋一遍MySQL索引结构(1)

    从一个简单的表开始 create table user( id int primary key, age int, height int, weight int, name varchar(32) ) ...

  8. 带你从头到尾捋一遍MySQL索引结构(2)

    前言 Hello我又来了,快年底了,作为一个有抱负的码农,我想给自己攒一个年终总结.索性这次把数据库中最核心的也是最难搞懂的内容,也就是索引,分享给大家. 这篇博客我会谈谈对于索引结构我自己的看法,以 ...

  9. 第36讲 谈谈MySQL支持的事务隔离级别,以及悲观锁和乐观锁的原理和应用场景

    在日常开发中,尤其是业务开发,少不了利用 Java 对数据库进行基本的增删改查等数据操作,这也是 Java 工程师的必备技能之一.做好数据操作,不仅仅需要对 Java 语言相关框架的掌握,更需要对各种 ...

随机推荐

  1. .html文件转换成.txt

    @ 思路 @-@ 简要 根据尖括号将文件分隔成字符串,建立一套判断字符串是否为标签的标准,若不为标签则为文本内容,存入结果文件中:   @-@ 详述 0. 建立两个哈希表: 哈希表1 unordere ...

  2. SVN 部署(基于 Linux)

    1.通过 yum 命令安装 svnserve,命令如下: # 此命令会全自动安装svn服务器相关服务和依赖,安装完成会自动停止命令运行 yum -y install subversion # 若需查看 ...

  3. c++ concurrency

    c++的并发涉及到这么几个东西: std::thread std::mutex std::lock_guard std::lock 参考资料: http://en.cppreference.com/w ...

  4. python学习之 %s %d 以及%变量名的含义

    %age是对前面age变量的引用,%d是将这个变量名为age的值加到其中,但是如果变量值为字符串类型,则这里应该写成%s 也就是说当变量值为数值类型,而且必须是整型类型 应该使用%d 当变量值为字符串 ...

  5. jQuery中操作属性的方法attr与prop的区别

    attr 与 prop 都可以对某个属性进行获取和设置的操作,二者的用法相同: <script src = 'jQuery.js'></script> <script&g ...

  6. 【Hadoop离线基础总结】数据仓库和hive的基本概念

    数据仓库和Hive的基本概念 数据仓库 概述 数据仓库英文全称为 Data Warehouse,一般简称为DW.主要目的是构建面向分析的集成化数据环境,主要职责是对仓库中的数据进行分析,支持我们做决策 ...

  7. MOS管和三极管开关特性

    不知道对不对? 待续!!!

  8. USACO 3.1 Contact

    http://www.nocow.cn/index.php/Translate:USACO/contact 题目大意:给一个只含0和1的序列,统计每个子序列的重复次数,并按次数递减来输出 考虑子序列时 ...

  9. 新鲜出炉高仿网易云音乐 APP

    我的引语 晚上好,我是吴小龙同学,我的公众号「一分钟GitHub」会推荐 GitHub 上好玩的项目,一分钟 get 一个优秀的开源项目,挖掘开源的价值,欢迎关注我. 项目中成长是最快的,如何成长,就 ...

  10. 深度学习中的序列模型演变及学习笔记(含RNN/LSTM/GRU/Seq2Seq/Attention机制)

    [说在前面]本人博客新手一枚,象牙塔的老白,职业场的小白.以下内容仅为个人见解,欢迎批评指正,不喜勿喷![认真看图][认真看图] [补充说明]深度学习中的序列模型已经广泛应用于自然语言处理(例如机器翻 ...