本文的重点在于如何构建一个高性能的MySQL索引，从中你可以学到如何分析一个索引是不是好索引，以及如何构建一个好的索引。

索引误区

多列索引

一个索引的常见误区是为每一列创建一个索引，如下面创建的索引：

CREATE TABLE `t` (

  `c1` varchar(50) DEFAULT NULL,

  `c2` varchar(50) DEFAULT NULL,

  `c3` varchar(50) DEFAULT NULL,

  KEY `c1` (`c1`),

  KEY `c2` (`c2`),

  KEY `c3` (`c3`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

t表里有三列，并且为每列创建了一个索引。创建索引的人为了能够快速访问表中的任何一列，因此为每一列添加了一个单独的索引。在多个列上创建索引通常并不能很好的提高MySQL查询性能，虽然说MySQL 5.0之后引入了索引合并策略，可以将多个单列索引合并成一个索引，但这并不总是有效的。同时创建多个索引的时候还会增加数据插入的成本，在插入数据的时候需要同时维护多个索引的写入操作。

索引的计算

看下面这条sql语句：

select name from student where id + 1 = 5

即使我们在student表的id列上建立索引，上面的这条SQL语句也无法使用索引。SQL语句中索引字段不能是表达式的一部分，也不能是函数的参数。

索引的长度以及选择性

尽量不要在一个很长的列上使用索引，否则会导致索引占用的空间很大，同时在进行数据的插入和更新的时候意味着更慢的速度。因此使用uuid列作为索引并不是一个好的选择。从上一篇文章中我们可以知道，为了加快数据的访问索引是需要常驻内存的，假如说我们把64位uuid作为索引，那么随着表中数据量的增加索引的大小也在急剧增加。同时因为uuid并没有顺序性，因此在数据插入的时候都需要从根节点找到当前索引的插入位置，如果同一个节点中的索引大小达到上限，还会导致节点分裂，更加降低了插入速度。

创建索引另外一个需要考虑的是索引的选择性，通常情况下我们会使用选择性高的列作为索引，但是也不一定一直是这样，下一节会介绍如何权衡索引的选择性。

创建高性能索引

选择正确的索引顺序

在选择索引的顺序的时候有一个原则：将索引选择性最高的列放在左侧，同时索引的顺序要与查询索引的顺序一致，并且要兼顾考虑排序和分组的需要。在一个多列B树多列中索引的顺序意味着索引首先按照最左侧的列进行排序，其次是第二列。所以无论是where语句还是order by语句都需要尽量满足这个顺序，这样才能更好的使用索引。

索引的选择性

列的选择性高的含义是通过这一列能够更多的过滤掉无用的数据，举个极端的例子，如果把自增id建成索引那么它的选择性是最高的，因为会把无用的数据都过滤掉，只会剩下一条有效数据。我们可以通过下面的方式来简单衡量某一个列的选择性：

select count(distinct columnA)/count(*) as selectivity from table

当上面的数据越大的时候意味着columnA的选择性越高。这种方式提供了一个衡量平均选择性的办法，但是也不一定是有效的，需要具体情况具体分析。

前缀索引

当遇到特别长的列，但又必须要建立索引的时候可以考虑建立前缀索引。前缀索引的含义是把某一列的前N个字符作为索引，创建前缀索引的方式如下：

alter table test add key(columnA(5));

上面这个语句就是把columnA的前5个字符创建为前缀索引。前缀索引是一种使索引更小、更快的有效办法。但是前缀所有有一个缺点：MySQL无法使用前缀索引来做order by和group by，也无法使用前缀索引做覆盖扫描。

聚簇索引和非聚簇索引

聚簇索引

聚簇索引代表一种数据的存储方式，表示同一个结构中保存了B-Tree索引和数据行。也就是说当建立聚簇索引的时候实际的数据行存放在索引的叶子节点上。这也决定了每个表只能有一个聚簇索引。

聚簇索引组织数据的方式如下图所示：

从图中可以看到索引的叶子节点和数据行是存放在一起的，这样的好处是可以直接读取到数据行。在创建表的时候如果我们不显式指定聚簇索引，那么MySQL将会按照下面的逻辑来选择聚簇索引：首先会通过主键列来聚集数据，如果没有主键列那么会选择唯一的非空索引来替代。如果还没有这样的索引那么会隐式的创建一个主键列来作为聚簇索引。

聚簇索引优点：

1、相关数据存放在一起，检索的时候降低IO的次数
2、数据访问更快
3、使用覆盖索引扫描的查询可以直接使用节点中的主键值

在使用上面的优点的时候聚簇索引也有一定的缺点：

1、聚簇索引将数据聚集在一起限制了插入速度，插入速度比较依赖于主键的顺序
2、更新索引的时候代价会变高
3、二级索引的访问的时候需要查找两次

非聚簇索引

非聚簇索引通常被称为二级索引，与聚簇索引的不同在于，非聚簇索引的叶子节点存放的是数据的行指针或者是一个主键值。这样在查找数据的时候首先定位到叶子节点上的主键值(或者行指针)，然后通过主键值再到聚簇索引中查找到对应的数据。从中我们可以看到对于非聚簇索引的查询需要走两次索引。下图是一个非聚簇索引：

这个索引是InnoDB中的耳机索引，叶子节点中存储的是索引和主键。对于MyISAM叶子节点存储的是索引和行指针。

覆盖索引

如果一个索引包含或者说覆盖所有需要查询的字段的值，那么就称为覆盖索引。覆盖索引可以极大的提高查询的效率，如果我们的查询中只查询索引，而不用去回表那应该最好不过了。

通常我们使用explain关键字来查看一个查询语句的执行计划，通过执行计划我们可以了解到查询的细节。如果是覆盖索引，我们会看到执行计划的Extra列里有”Using Index”的信息。在查询语句中一般我们希望是where条件中的语句尽量能被覆盖，并且顺序要跟索引的保持一致。还有一个需要注意的点是MySQL不能在索引中使用like操作，这样会导致后面的索引失效。

总结

本文主要讲了几种索引的原理以及如何构建一个高性能的索引。索引的优先是一个渐进的过程，随着数据量和查询语句的不同而发生变化，重要的是了解索引的原理，这样做出正确的优化。下一篇文章中将会介绍explain关键字，教你如何来看执行计划，以及如何判断一个查询语句是否需要优化的。

如何构建高性能MySQL索引的更多相关文章

[转]构建高性能MySQL体系
来源:http://www.yunweipai.com/archives/21232.html 构建高性能MySQL系统涵盖从单机.硬件.OS.文件系统.内存到MySQL 本身的配置,以及schema ...
MySQL全面瓦解24：构建高性能索引（策略篇）
学习如果构建高性能的索引之前,我们先来了解下之前的知识,以下两篇是基础原理,了解之后,对面后续索引构建的原则和优化方法会有更清晰的理解: MySQL全面瓦解22:索引的介绍和原理分析 MySQL全面瓦 ...
MySQL索引基础知识点
什么是索引索引类似于书本目录,是数据库存储引擎维护的用于快速查找到记录的一种数据结构,它是对查询性能优化的最有效手段. MySQL索引是在存储引擎层而不是服务器层实现的,不同存储引擎的索引工作方式也 ...
MySQL全面瓦解25：构建高性能索引（案例分析篇）
回顾一下上面几篇索引相关的文章: MySQL全面瓦解22:索引的介绍和原理分析 MySQL全面瓦解23:MySQL索引实现和使用 MySQL全面瓦解24:构建高性能索引(策略篇) 索引的十大原则 1. ...
好书推荐之Mysql三剑客：《高性能Mysql》、《Mysql技术内幕》、《数据库索引设计与优化》
Mysql三剑客系列书籍: 大佬推荐首先推荐<高性能 MySQL>,这本书是 MySQL 领域的经典之作,拥有广泛的影响力.不但适合数据库管理员(DBA)阅读,也适合开发人员参考学习.不 ...
高性能MySQL笔记第5章创建高性能的索引
索引(index),在MySQL中也被叫做键(key),是存储引擎用于快速找到记录的一种数据结构.索引优化是对查询性能优化最有效的手段. 5.1 索引基础索引的类型索引是在存储引擎层而 ...
mysql笔记02 创建高性能的索引
创建高性能的索引 1. 索引(在MySQL中也叫做"键(key)")是存储引擎用于快速找到记录的一种数据结构. 2. 索引可以包含一个或多个列的值.如果索引包含多个列,那么列的顺序 ...
高性能Mysql笔记 — 索引
index优化对于频繁作为查询条件的字段使用索引注意索引字段类型的隐式转换,数据库类型和应用类型要一致索引的种类唯一索引,成为索引的列不能重复单列索引,一个索引只包含一列单列前缀索引,有些 ...
高性能MySQL中的三星索引
高性能MySQL中的三星索引我对此提出了深深的疑问: 一星:相关的记录指的是什么??(相关这个词很深奥,“相关部门”是什么部门) 二星:如果建立了B-Tree(B+Tree)索引,数据就有序了.三星 ...

随机推荐

Creating a Physical Standby Database 11g
1.Environment Item Primary database standby database Platform Redhat 5.4 Redhat 5.4 Hostname gc1 gc2 ...
Java编程的逻辑 (40) - 剖析HashMap
本系列文章经补充和完善,已修订整理成书<Java编程的逻辑>,由机械工业出版社华章分社出版,于2018年1月上市热销,读者好评如潮!各大网店和书店有售,欢迎购买,京东自营链接:http:/ ...
读取 classes下的配置文件
调用: Configure.getValue("discount.strategy.class"); 配置类: package com.util; import com.sun.j ...
JavaScript开源跨平台框架NativeScript
NativeScript是一款使用JavaScript语言来构建跨平台原生移动应用的开源框架,支持iOS.Android和Windows Phone.且NativeScript的使用没有过多繁杂的要求 ...
关于1KB病毒的清除
以前中过很多次的1KB病毒,这种病毒来源一般都是U盘,就是去打印店插个U盘,回来插自己电脑发现U盘中毒了. 中毒特征就是根目录下的所有文件夹都变成快捷方式,都只有1KB大小,而根目录下的文件和压缩包不 ...
2017年第八届蓝桥杯C/C++B组省赛题目解析
一. 购物单小明刚刚找到工作,老板人很好,只是老板夫人很爱购物.老板忙的时候经常让小明帮忙到商场代为购物.小明很厌烦,但又不好推辞. 这不,XX大促销又来了!老板夫人开出了长长的购物单,都是有打折优 ...
第三百三十五节，web爬虫讲解2—Scrapy框架爬虫—豆瓣登录与利用打码接口实现自动识别验证码
第三百三十五节,web爬虫讲解2—Scrapy框架爬虫—豆瓣登录与利用打码接口实现自动识别验证码打码接口文件 # -*- coding: cp936 -*- import sys import os ...
Linux下查看某个进程的线程数量(转）
转自:https://www.cnblogs.com/caosiyang/archive/2012/10/15/2724585.html 有些时候需要确实进程内部当前运行着多少线程,那么以下几个方法值 ...
(转)FFmpeg源代码简单分析：avformat_find_stream_info()
目录(?)[+] ===================================================== FFmpeg的库函数源代码分析文章列表: [架构图] FFmpeg源代码结 ...
CI框架 -- 创建类库
当我们使用 “类库” 这个词的时候,通常我们指的是位于 libraries 这个目录下的那些类. 接下来我们将介绍如何在 application/libraries 目录下创建你自己的类库,和全局的 ...

如何构建高性能MySQL索引