:接触mysq也有两年左右的时间了,但是对该数据库的理解自认还比较初级,看过很多文章,也看过一些相关的书籍,依然小白。。。。(这里个人总结是两点主要原因:1.对mysql的学习大部分都是源于看一些杂七杂八的文章,很多文章本身表述有误或不准确。2.实操较少,平时增删改查索引的使用很常规,缺少钻研精神 3.第三点也就是写这篇文章的主要目的,看到的东西经常是看了就看了,过一段时间就忘记了,然后反复重复这样的经历,时间花的不少,但是这样永远不会对mysql系统掌握,故而打算通过文章把对mysql的理解落地,理解多少写多少,可能会东一点西一点比较乱,日后逐渐完善吧)

对索引的认识:

什么是索引?

我最初的理解是把索引当场一本字典的目录。

假如一本字典没有目录,那我们想查到某个字只能从头找到尾。

所以才会对字典按照页码来进行划分,并且在字典的最开始几页,有相应的目录可以让我们知道目标字在哪一页,从而快速定位到目标。

而且根据需求的不同,一般用过字典的小伙伴都知道,有按照拼音开头的目录,有按照偏旁部首开头的目录,等等。。。 其实和mysql中的 主键索引 联合索引 等等种类的索引是异曲同工的。

数据结构:

mysql索引使用的数据结构是B+树,目前大部分数据库系统都采用 B+Tree 或 B-Tree 这两种数据结构,本文不打算详解其中原因(对两种数据结构细节感兴趣的可以参考其他文章)

简单来说,索引文件一般是存在于硬盘当中,由于数据量大无法全部一次加载进内存。而磁盘的IO读取代价相比于内存读取代价要高很多倍,所以我们在选择数据结构上面,最重要的一点就是尽可能减少对磁盘io的操作。

数组:索引文件无法一次加载进内存

链表:查询需要从头到尾的查询

上面的两种B树特点决定了他们可以保证尽可能少的进行io操作,而且相对于平衡二叉树、二叉搜索树等数据结构,树的高度要低很多,查询对应的io次数更少。

而B+Tree和B-Tree的区别主要是前者的非叶子节点不存储数据,目的是能够存储更多的索引,保证整颗树更“矮”,但是想要找到数据必须进行树的高度次IO操作(即B+Tree的高度为3,则需要进行3次IO操作,在叶子节点上找到目标数据)

而B-Tree不论叶子节点还是非叶子节点都存放数据,好处是可能在没有到达叶子结点的时候就找到了目标数据

但是B-Tree如果想要存放和B+Tree相同量的索引,则必须让树的高度增加,也就是增加io次数,所以B+Tree相对更稳定

聚集索引和非聚集索引:

在mysql当中,不同的存储引擎对索引的实现是不同的,本文介绍常见的两种mysql存储存储引擎对索引的实现,即MyISAM存储引擎和InnoDB存储引擎,二者对索引的实现分别为非聚集索引(非聚簇索引)和聚集索引(非聚簇索引),这也是最常见的两种索引的实现

1、MyISAM索引实现:

MyISAM引擎使用的是非聚集索引的形式,简单来说是索引和数据是分开存放的,索引存放的是数据文件的地址,我们需要先找到索引,然后再通过索引找到数据

在MyISAM引擎中,主键和一般索引在结构上没有区别,只是主键必须是唯一的,但是在查询时,普通索引和主键索引都是需要先获得数据文件地址,再去找到相应的数据

2、InnoDB索引实现

该存储引擎使用的是聚集索引,该索引方式最明显的特点就是主键索引和数据是在一起的(同一个文件中),可以理解为找到了主键索引也就找到了数据,不需要二次查找

而该索引结构当中的普通索引,想找到数据,也必须通过主键索引进行二次查找才可以

即:通过主键索引查找数据,查找一次 ,而通过普通索引查找数据,则需要普通索引找到主键索引,通过主键索引找到数据,也就是所谓的二次查找

如图为:mysql中两种索引方式的对比

如图,为B+树组织数据的方式:

实际存储时当然不会每个节点只存3条数据。

以InnoDB引擎为例,简单计算一下一颗B+树可以存放多少行数据。

B+树特点:只有叶子节点存储数据,而非叶子节点存放的是用来找到叶子节点数据的索引(如上图:key和指针)

InnoDB存储引擎的最小存储单元为16k(就像操作系统的最小单元为4k 即1页),在这即B+树的一个节点的大小为16k

假设数据库一条数据的大小为1k,则一个节点可以存储16条数据

而非叶子节点,key一般为主键假设8字节,指针在InnoDB中是6字节,一共为14字节,一个节点可以存储 16384/14 = 1170个索引指针

可以算出一颗高度为2的树(即根节点为存储索引指针节点,还有1170个叶子节点存储数据),每个节点可以存储16条数据,一共1170*16条数据  = 18720条

高度为3的树,可以存放 1170 * 1170 * 16 = 21902400条记录

两千多万条数据,我们只需要B+树为3层的数据结构就可以完成,通过主键查询只需要3次IO操作就能查到对应记录。

初识mysql索引 - 小白篇的更多相关文章

  1. MySQL索引——总结篇

    MySQL索引 MySQL索引 数据库的三范式,反模式 零碎知识 索引 索引原理 B Tree索引 B+Tree索引 B Tree 与 B+Tree的比较 聚集索引和辅助索引 聚集索引的注意事项 索引 ...

  2. mysql学习【第1篇】:初识MySQL

    狂神声明 : 文章均为自己的学习笔记 , 转载一定注明出处 ; 编辑不易 , 防君子不防小人~共勉 ! mysql学习[第1篇]:初识MySQL 只会写代码的是码农:学好数据库,基本能混口饭吃:在此基 ...

  3. 小白两篇博客熟练操作MySQL 之 第二篇

    小白两篇博客熟练操作MySQL  之   第二篇 一. 视图 视图是一个虚拟表,其本质是根据SQL语句获取动态的数据集,并为其命名,用户使用时只需使用名称即可获取结果集, 并可以将其当做表来使用. s ...

  4. 小白两篇博客熟练操作MySQL 之 第一篇

    小白两篇博客熟悉操作MySQL  之   第一篇 一.概述 1. 什么是数据库? 答: 储存数据的仓库, 如: 在ATM的事例中创建的一个db 目录, 称为数据库 2. 什么是Mysql, Oracl ...

  5. Mysql高手系列 - 第22篇:深入理解mysql索引原理,连载中

    Mysql系列的目标是:通过这个系列从入门到全面掌握一个高级开发所需要的全部技能. 欢迎大家加我微信itsoku一起交流java.算法.数据库相关技术. 这是Mysql系列第22篇. 背景 使用mys ...

  6. Mysql索引(一篇就够le)

    我想很多人对mysql的认知可能就是CRUD(代表创建(Create).更新(Update).读取(Retrieve)和删除(Delete)操作),也不敢说自己会用和熟悉mysql,当然我就是其中一个 ...

  7. 「 MySQL高级篇 」MySQL索引原理,设计原则

    大家好,我是melo,一名大二后台练习生,大年初三,我又来充当反内卷第一人了!!! 专栏引言 MySQL,一个熟悉又陌生的名词,早在学习Javaweb的时候,我们就用到了MySQL数据库,在那个阶段, ...

  8. 「MySQL高级篇」MySQL索引原理,设计原则

    大家好,我是melo,一名大二后台练习生,大年初三,我又来充当反内卷第一人了!!! 专栏引言 MySQL,一个熟悉又陌生的名词,早在学习Javaweb的时候,我们就用到了MySQL数据库,在那个阶段, ...

  9. mysql 索引篇

    一.索引优化   索引优化主要还是依赖explain命令,关于explain命令相信大家并不陌生,具体用法和字段含义可以参考官网explain-output,这里需要强调rows是核心指标,绝大部分r ...

随机推荐

  1. [一]基本sqlplus命令

    基本sqlplus命令: 1: sqlplus scott/tiger ; #简化连接数据库 2:show user; #想知道当前登陆的用户是哪一位 3:conn 用户名[/密码] [AS SYSD ...

  2. 【算法随记五】使用FFT变换自动去除图像中严重的网纹。

    这个课题在很久以前就已经有所接触,不过一直没有用代码去实现过.最近买了一本<机器视觉算法与应用第二版>书,书中再次提到该方法:使用傅里叶变换进行滤波处理的真正好处是可以通过使用定制的滤波器 ...

  3. 夯实Java基础系列21:Java8新特性终极指南

    本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial 喜欢的话麻烦点下 ...

  4. Laravel 5 中文文档 CHM 版

    使用 Microsoft HTML Help Workshop 做了一个 Laravel 5.4 中文文档的 CHM 版本. 百度网盘下载地址:http://pan.baidu.com/s/1dFN2 ...

  5. 排坑日记之批量从库IO进程停止

    早上刚睁眼,看到了一堆数据库告警的短信,其中一个内容如下: Problem started at 05:02:58 on 2019.10.12 Problem name: Slave is stopp ...

  6. 【Java】后台将文件上传至远程服务器

    问题:由于系统在局域网(能访问外网)内,但外网无法请求局域网内服务器文件和进行处理文件. 解决:建立文件服务器,用于存储文件及外网调用. 客户端(文件上传): package cn.hkwl.lm.u ...

  7. 一款功能强大的TCP/UDP工具---flynet

    前言 前段时间做某个项目,由于涉及到tcp/udp方面的知识比较多,于是就索性趁热打铁,写个工具来强化相关知识.另外由于并非十分擅长Golang,所以也顺便再了解下Golang吧. 简介 flynet ...

  8. pycharm 激活码 2019/12最新福利(3)

    K6IXATEF43-eyJsaWNlbnNlSWQiOiJLNklYQVRFRjQzIiwibGljZW5zZWVOYW1lIjoi5o6I5p2D5Luj55CG5ZWGOiBodHRwOi8va ...

  9. mysqlbinlog增量恢复(基于使用事件位置position的恢复)

    1.在xtrabackup 备份+还原文章中我们记录了备份到的binlog文件名和position点位置使用如下命令就可以进行增量的恢复了shell> mysqlbinlog --stop-po ...

  10. Django实现WebSSH操作Kubernetes Pod

    优秀的系统都是根据反馈逐渐完善出来的 上篇文章介绍了我们为了应对安全和多分支频繁测试的问题而开发了一套Alodi系统,Alodi可以通过一个按钮快速构建一套测试环境,生成一个临时访问地址,详细信息可以 ...