1、MySQL中的索引

在MySQL,索引是由B+树实现的,B+是一种与B树十分类似的数据结构。

形如下面这种:

其结构特点

(1)有n课子树的结点中含有n个关键码。

(2)非根节点子节点数: ceil(m/2)<= k <= m(ceil是天花板函数的意思,也就是向上取整,比如ceil(1.2)=2 ),m为该B+树的阶数。根节点最少有两个子节点,最多同样为m个。

(2)叶子节点包含了全部关键码的信息,及指向含有这些关键码记录的指针。并且叶子节点根据关键码的大小自小至大的顺序链接,叶子节点有相邻结点的指针。

(3)所有的非叶子节点(B+树中也称内部结点,索引节点)可以看成索引部分,都不存储数据,只存储索引,结点中仅含有其子树根节点中最大(或者最小)的关键码,数据都存储在叶子节点中。

问题:为什么索引不适用B树而是B+树实现?

B+树比B树的优点:

  • IO次数少:B+树的中间节点只存放索引,数据都存在叶子节点中,所以结点中存取的数据更多,使得B+树更加矮胖,因此可以减少I/O次数。(这里IO指的是磁盘I/O,每一次查询,需要把某结点读到内存,然后把目标数和结点中的比较,不一样则继续I/O)

  • 范围查询效率更高:B树需要中序遍历整个树,B+树只需要遍历叶子结点中的链表。

  • 查询效率更加稳定:B树查询某个数据最好情况只需到根节点,而最坏情况需要遍历整个二叉树。

    B+树每次查询都需要从根节点到叶子结点,路径长度相同,每次查询效率接近。

问题:为什么不采用效率更高的哈希查找?

采用B+树索引与哈希索引的比较:

哈希索引能以 O(1) 时间进行查找,但是只支持精确查找,无法用于部分查找和范围查找,无法用于排序与分组。B+树索引支持大于小于等于查找,范围查找。哈希索引遇到大量哈希值相等的情况后查找效率会降低。哈希索引不支持数据的排序。

2、MySQL的两种数据库引擎

(1)InnoDB(in-no-db)

  • 支持事务,可以进行Commit和Rollback。
  • 支持表级锁和行级锁,增强了并发性。
  • 支持外键。
  • 支持在线热备份。

(2)MyISAM(mai-ai-zem)

  • 不支持事务
  • 只支持表级锁,不支持行级锁
  • 不支持外键
  • MyISAM 崩溃后发生损坏的概率比 InnoDB 高很多,而且恢复的速度也更慢MyISAM 支持压缩表和空间数据索引,比InnoDB需要的内存和存储更少MyISAM 管理非事务表。

它提供高速存储和检索(MyISAM强调的是性能,每次查询具有原子性,其执行速度比InnoDB更快),以及全文搜索能力。如果表比较小,或者是只读数据(有大量的SELECT),还是可以使用MyISAM。InnoDB 支持事务,并发情况下有很好的性能,基本可以替代MyISAM。

热备份和冷备份

热备份:在数据库运行的情况下备份的方法。

优点:可按表或用户备份,备份时数据库仍可使用,可恢复至任一时间点。但是不能出错。

冷备份:数据库正常关闭后,将关键性文件复制到另一位置的备份方式。

优点:操作简单快速,恢复简单。

3、主从复制

主从复制(Replication)是指数据可以从一个MySQL数据库主服务器复制到一个或多个从服务器,从服务器可以复制主服务器中的所有数据库或者特定的数据库,或者特定的表。默认采用异步模式。

实现原理:

  • 主服务器 binary log dump 线程:将主服务器中的数据更改(增删改)日志写入 Binary log 中。
  • 从服务器 I/O 线程:负责从主服务器读取binary log,并写入本地的 Relay log。
  • 从服务器 SQL 线程:负责读取 Relay log,解析出主服务器已经执行的数据更改,并在从服务器中重新执行(Replay),保证主从数据的一致性。

4、关系型数据库和非关系型数据库

关系型数据库(如Oracle,MySQL)

表和表、表和字段、数据和数据存在着关系,它通过数据、关系和对数据的约束三者组成的数据模型来存放和管理数据。

优点:

  • 数据之间存在关系,进行数据的增删改查的时候较为方便。
  • 关系型数据库是有事务操作的,便于保证数据的完整性和一致性。
  • 可以通用SQL语言,便于操作者学习使用。

缺点

  • 因为数据和数据是有关系的,底层会运行相关的算法,大量算法会降低系统的效率,会降低性能。
  • 面对海量数据的增删改查和维护的时候会显的无能为力。
  • 因为是固定的表结构类型,所以灵活度较低。

非关系数据库(如redis和MangDB)

非关系型数据库严格上不是一种数据库,而是一种数据结构化存储方法的集合,可以是文档或者键值对等。

为了处理大量数据,非关系数据库设计之初就是为了去替代关系型数据库。

优点

  • 存储格式较为灵活,存储数据的格式可以是key-value,文档,图片形式等等,应用成精更加的广泛。
  • 速度更快,不仅支持硬盘这样的载体,还支持另外的存储器来存储数据,如Redis就支持内存来存储数据。
  • 能支持对大量数据的查找和读写。

缺点

  • 不支持SQL语言的通用,需要单独去学习其操作使用。
  • 非关系数据库一般没有事务处理,较难保证数据的完整性和安全性。
  • 数据结构较复杂,如果要进行复杂的查询会加大难度。

数据库基础知识详解五:MySQL中的索引和其两种引擎、主从复制以及关系型/非关系型数据库的更多相关文章

  1. [数据库事务与锁]详解五: MySQL中的行级锁,表级锁,页级锁

    注明: 本文转载自http://www.hollischuang.com/archives/914 在计算机科学中,锁是在执行多线程时用于强行限制资源访问的同步机制,即用于在并发控制中保证对互斥要求的 ...

  2. 数据库基础知识详解三:MVCC、范式以及表连接方式

    写在文章前:本系列文章用于博主自己归纳复习一些基础知识,同时也分享给可能需要的人,因为水平有限,肯定存在诸多不足以及技术性错误,请大佬们及时指正. 8.MVCC 多版本并发控制(Multi-Versi ...

  3. 数据库基础知识详解四:存储过程、视图、游标、SQL语句优化以及索引

    写在文章前:本系列文章用于博主自己归纳复习一些基础知识,同时也分享给可能需要的人,因为水平有限,肯定存在诸多不足以及技术性错误,请大佬们及时指正. 11.存储过程 ​ 存储过程是事先经过编译并存储在数 ...

  4. RabbitMQ,Apache的ActiveMQ,阿里RocketMQ,Kafka,ZeroMQ,MetaMQ,Redis也可实现消息队列,RabbitMQ的应用场景以及基本原理介绍,RabbitMQ基础知识详解,RabbitMQ布曙

    消息队列及常见消息队列介绍 2017-10-10 09:35操作系统/客户端/人脸识别 一.消息队列(MQ)概述 消息队列(Message Queue),是分布式系统中重要的组件,其通用的使用场景可以 ...

  5. RabbitMQ基础知识详解

    什么是MQ? MQ全称为Message Queue, 消息队列(MQ)是一种应用程序对应用程序的通信方法.MQ是消费-生产者模型的一个典型的代表,一端往消息队列中不断写入消息,而另一端则可以读取队列中 ...

  6. Cisco路由技术基础知识详解

    第一部分 请写出568A的线序(接触网络第一天就应该会的,只要你掐过,想都能想出来) .网卡MAC地址长度是(  )个二进制位(16进制与2进制的换算关系,只是换种方式问,不用你拿笔去算) A.12  ...

  7. Python基础知识详解 从入门到精通(七)类与对象

    本篇主要是介绍python,内容可先看目录其他基础知识详解,欢迎查看本人的其他文章Python基础知识详解 从入门到精通(一)介绍Python基础知识详解 从入门到精通(二)基础Python基础知识详 ...

  8. MySQL(五) MySQL中的索引详讲

    序言 之前写到MySQL对表的增删改查(查询最为重要)后,就感觉MySQL就差不多学完了,没有想继续学下去的心态了,原因可能是由于别人的影响,觉得对于MySQL来说,知道了一些复杂的查询,就够了,但是 ...

  9. innodb和myisam数据库文件存储详解以及mysql表空间

    数据库常用的两种引擎有Innodb和Myisam,关于二者的区别参考:https://www.cnblogs.com/qlqwjy/p/7965460.html 1.关于数据库的存储在两种引擎的存储是 ...

随机推荐

  1. volatile 变量和 atomic 变量有什么不同?

    Volatile 变量可以确保先行关系,即写操作会发生在后续的读操作之前, 但它并不 能保证原子性.例如用 volatile 修饰 count 变量那么 count++ 操作就不是原子 性的. 而 A ...

  2. 谈一谈 Kafka 的再均衡?

    在Kafka中,当有新消费者加入或者订阅的topic数发生变化时,会触发Rebalance(再均衡:在同一个消费者组当中,分区的所有权从一个消费者转移到另外一个消费者)机制,Rebalance顾名思义 ...

  3. dos 循环读取当前文件夹下的视频名字

    @echo off for /R %%i in (*.mp4) do ( echo -isma %%~nxi ) pause

  4. 什么是 Spring Framework?

    Spring 是一个开源应用框架,旨在降低应用程序开发的复杂度.它是轻量级.松 散耦合的.它具有分层体系结构,允许用户选择组件,同时还为 J2EE 应用程序 开发提供了一个有凝聚力的框架.它可以集成其 ...

  5. 区分构造函数注入和 setter 注入?

    构造函数注入 setter 注入 没有部分注入 有部分注入 不会覆盖 setter 属性 会覆盖 setter 属性 任意修改都会创建一个新实例 任意修改不会创建一个新实例 适用于设置很多属性 适用于 ...

  6. Django中间件 (middleware)

    中间件是处理django的请求和响应的框架级别的钩子,本质是一个类(直白一点中间件是帮助我们在视图函数执行之前和执行之后都可以做一些额外的操作) 由于其影响的是全局,所以需要谨慎使用,使用不当会影响性 ...

  7. java支持多继承吗

    java不支持多继承,只支持单继承(即一个类只能有一个父类).但是java接口支持多继承,即一个子接口可以有多个父接口.(接口的作用是用来扩展对象的功能,一个子接口继承多个父接口,说明子接口扩展了多个 ...

  8. 记录md的偏好设置

  9. SVN回滚步骤

  10. 摩拜单车微信小程序开发技术总结

    前言 摩拜单车小程序已于微信小程序上线第一天正式发布,刷爆微博媒体朋友圈.本文主要讲讲技术方向的总结,在段时间的开发周期内内如何一步步从学习到进阶. 思维转变 微信小程序没有HTML的常用标签,而是类 ...