数据库基础知识详解五:MySQL中的索引和其两种引擎、主从复制以及关系型/非关系型数据库
1、MySQL中的索引
在MySQL,索引是由B+树实现的,B+是一种与B树十分类似的数据结构。
形如下面这种:
其结构特点:
(1)有n课子树的结点中含有n个关键码。
(2)非根节点子节点数: ceil(m/2)<= k <= m(ceil是天花板函数的意思,也就是向上取整,比如ceil(1.2)=2 ),m为该B+树的阶数。根节点最少有两个子节点,最多同样为m个。
(2)叶子节点包含了全部关键码的信息,及指向含有这些关键码记录的指针。并且叶子节点根据关键码的大小自小至大的顺序链接,叶子节点有相邻结点的指针。
(3)所有的非叶子节点(B+树中也称内部结点,索引节点)可以看成索引部分,都不存储数据,只存储索引,结点中仅含有其子树根节点中最大(或者最小)的关键码,数据都存储在叶子节点中。
问题:为什么索引不适用B树而是B+树实现?
B+树比B树的优点:
IO次数少:B+树的中间节点只存放索引,数据都存在叶子节点中,所以结点中存取的数据更多,使得B+树更加矮胖,因此可以减少I/O次数。(这里IO指的是磁盘I/O,每一次查询,需要把某结点读到内存,然后把目标数和结点中的比较,不一样则继续I/O)
范围查询效率更高:B树需要中序遍历整个树,B+树只需要遍历叶子结点中的链表。
查询效率更加稳定:B树查询某个数据最好情况只需到根节点,而最坏情况需要遍历整个二叉树。
B+树每次查询都需要从根节点到叶子结点,路径长度相同,每次查询效率接近。
问题:为什么不采用效率更高的哈希查找?
采用B+树索引与哈希索引的比较:
哈希索引能以 O(1) 时间进行查找,但是只支持精确查找,无法用于部分查找和范围查找,无法用于排序与分组。B+树索引支持大于小于等于查找,范围查找。哈希索引遇到大量哈希值相等的情况后查找效率会降低。哈希索引不支持数据的排序。
2、MySQL的两种数据库引擎
(1)InnoDB(in-no-db)
- 支持事务,可以进行Commit和Rollback。
- 支持表级锁和行级锁,增强了并发性。
- 支持外键。
- 支持在线热备份。
(2)MyISAM(mai-ai-zem)
- 不支持事务
- 只支持表级锁,不支持行级锁
- 不支持外键
- MyISAM 崩溃后发生损坏的概率比 InnoDB 高很多,而且恢复的速度也更慢MyISAM 支持压缩表和空间数据索引,比InnoDB需要的内存和存储更少MyISAM 管理非事务表。
它提供高速存储和检索(MyISAM强调的是性能,每次查询具有原子性,其执行速度比InnoDB更快),以及全文搜索能力。如果表比较小,或者是只读数据(有大量的SELECT),还是可以使用MyISAM。InnoDB 支持事务,并发情况下有很好的性能,基本可以替代MyISAM。
热备份和冷备份
热备份:在数据库运行的情况下备份的方法。
优点:可按表或用户备份,备份时数据库仍可使用,可恢复至任一时间点。但是不能出错。
冷备份:数据库正常关闭后,将关键性文件复制到另一位置的备份方式。
优点:操作简单快速,恢复简单。
3、主从复制
主从复制(Replication)是指数据可以从一个MySQL数据库主服务器复制到一个或多个从服务器,从服务器可以复制主服务器中的所有数据库或者特定的数据库,或者特定的表。默认采用异步模式。
实现原理:
- 主服务器 binary log dump 线程:将主服务器中的数据更改(增删改)日志写入 Binary log 中。
- 从服务器 I/O 线程:负责从主服务器读取binary log,并写入本地的 Relay log。
- 从服务器 SQL 线程:负责读取 Relay log,解析出主服务器已经执行的数据更改,并在从服务器中重新执行(Replay),保证主从数据的一致性。
4、关系型数据库和非关系型数据库
关系型数据库(如Oracle,MySQL):
表和表、表和字段、数据和数据存在着关系,它通过数据、关系和对数据的约束三者组成的数据模型来存放和管理数据。
优点:
- 数据之间存在关系,进行数据的增删改查的时候较为方便。
- 关系型数据库是有事务操作的,便于保证数据的完整性和一致性。
- 可以通用SQL语言,便于操作者学习使用。
缺点:
- 因为数据和数据是有关系的,底层会运行相关的算法,大量算法会降低系统的效率,会降低性能。
- 面对海量数据的增删改查和维护的时候会显的无能为力。
- 因为是固定的表结构类型,所以灵活度较低。
非关系数据库(如redis和MangDB)
非关系型数据库严格上不是一种数据库,而是一种数据结构化存储方法的集合,可以是文档或者键值对等。
为了处理大量数据,非关系数据库设计之初就是为了去替代关系型数据库。
优点:
- 存储格式较为灵活,存储数据的格式可以是key-value,文档,图片形式等等,应用成精更加的广泛。
- 速度更快,不仅支持硬盘这样的载体,还支持另外的存储器来存储数据,如Redis就支持内存来存储数据。
- 能支持对大量数据的查找和读写。
缺点:
- 不支持SQL语言的通用,需要单独去学习其操作使用。
- 非关系数据库一般没有事务处理,较难保证数据的完整性和安全性。
- 数据结构较复杂,如果要进行复杂的查询会加大难度。
数据库基础知识详解五:MySQL中的索引和其两种引擎、主从复制以及关系型/非关系型数据库的更多相关文章
- [数据库事务与锁]详解五: MySQL中的行级锁,表级锁,页级锁
注明: 本文转载自http://www.hollischuang.com/archives/914 在计算机科学中,锁是在执行多线程时用于强行限制资源访问的同步机制,即用于在并发控制中保证对互斥要求的 ...
- 数据库基础知识详解三:MVCC、范式以及表连接方式
写在文章前:本系列文章用于博主自己归纳复习一些基础知识,同时也分享给可能需要的人,因为水平有限,肯定存在诸多不足以及技术性错误,请大佬们及时指正. 8.MVCC 多版本并发控制(Multi-Versi ...
- 数据库基础知识详解四:存储过程、视图、游标、SQL语句优化以及索引
写在文章前:本系列文章用于博主自己归纳复习一些基础知识,同时也分享给可能需要的人,因为水平有限,肯定存在诸多不足以及技术性错误,请大佬们及时指正. 11.存储过程 存储过程是事先经过编译并存储在数 ...
- RabbitMQ,Apache的ActiveMQ,阿里RocketMQ,Kafka,ZeroMQ,MetaMQ,Redis也可实现消息队列,RabbitMQ的应用场景以及基本原理介绍,RabbitMQ基础知识详解,RabbitMQ布曙
消息队列及常见消息队列介绍 2017-10-10 09:35操作系统/客户端/人脸识别 一.消息队列(MQ)概述 消息队列(Message Queue),是分布式系统中重要的组件,其通用的使用场景可以 ...
- RabbitMQ基础知识详解
什么是MQ? MQ全称为Message Queue, 消息队列(MQ)是一种应用程序对应用程序的通信方法.MQ是消费-生产者模型的一个典型的代表,一端往消息队列中不断写入消息,而另一端则可以读取队列中 ...
- Cisco路由技术基础知识详解
第一部分 请写出568A的线序(接触网络第一天就应该会的,只要你掐过,想都能想出来) .网卡MAC地址长度是( )个二进制位(16进制与2进制的换算关系,只是换种方式问,不用你拿笔去算) A.12 ...
- Python基础知识详解 从入门到精通(七)类与对象
本篇主要是介绍python,内容可先看目录其他基础知识详解,欢迎查看本人的其他文章Python基础知识详解 从入门到精通(一)介绍Python基础知识详解 从入门到精通(二)基础Python基础知识详 ...
- MySQL(五) MySQL中的索引详讲
序言 之前写到MySQL对表的增删改查(查询最为重要)后,就感觉MySQL就差不多学完了,没有想继续学下去的心态了,原因可能是由于别人的影响,觉得对于MySQL来说,知道了一些复杂的查询,就够了,但是 ...
- innodb和myisam数据库文件存储详解以及mysql表空间
数据库常用的两种引擎有Innodb和Myisam,关于二者的区别参考:https://www.cnblogs.com/qlqwjy/p/7965460.html 1.关于数据库的存储在两种引擎的存储是 ...
随机推荐
- 半吊子菜鸟学Web开发4 --Html css学习2
1<a>标签,链接到另一个页面 <a href="目标网址" title="鼠标滑过显示的文本">链接显示的文本</a> H ...
- 整理分布式锁:业务场景&分布式锁家族&实现原理
1.引入业务场景 业务场景一出现: 因为小T刚接手项目,正在吭哧吭哧对熟悉着代码.部署架构.在看代码过程中发现,下单这块代码可能会出现问题,这可是分布式部署的,如果多个用户同时购买同一个商品,就可能导 ...
- 什么是Java序列化,如何实现Java序列化?或者请解释Serializable接口的作用?
象序列化的目标是将对象保存到磁盘中,或允许在网络中直接传输对象,对象序列化机制允许把内存中的Java对象转换成平台无关的二进制流,从而允许把这种二进制流持久保存在磁盘上,通过网络将这种二进制流传输到另 ...
- MariaDB 存储引擎一览(官方文档翻译)
inline-translate.translate { } inline-translate.translate::before, inline-translate.translate::after ...
- HTML、JavaScript、Java、CSS它们的注释有哪些相同和不同?
<!--html--> /*css*/ //javascript /*javascript*/
- HTML 5中的输出元素是什么?
当你需要计算两个输入的结果并将结果放到一个标签里的时候,就需要输出元素了.比如你有两个文本框(参见下图),你想要让这些文本框数字相加,然后输出给标签. 下面就是如何使用HTML 5代码输出元素. &l ...
- jvm性能调优工具
1.jstat 命令 jstat: 查看类装载,内存,垃圾收集,gc相关信息 命令参数 # jstat -option -t #option:参数选项,-t:显示系统的时间 # jstat -opti ...
- Spark学习摘记 —— RDD转化操作API归纳
本文参考 在阅读了<Spark快速大数据分析>动物书后,大概了解到了spark常用的api,不过书中并没有给予所有api具体的示例,而且现在spark的最新版本已经上升到了2.4.5,动物 ...
- zhilizhili-ui 荡平ie8910 还我前端清净地
zhilizhili-ui 给大家带来一个目前最新版本的ie8方案 特色 flexbox部分功能 vw vh calc部分功能 angular1.4 todo avalon是因为无法和polyfill ...
- java中的方法(method)到底怎么用?给个例子
7.方法(method) 被调例子, int add(int x, int y){ return x+y; } 主调例子, for example: int result = add(5,3); ...