MySQL高级10-InnoDB引擎存储架构
一、逻辑存储结构
表空间(Tablespace):一个mysql实例,及一个数据库实例,可以对应多个表空间(ibd文件),用于存储记录,索引等数据。
段(Segment):分为数据段(Leaf node segment)、索引段(Non-leaf node segment)、回滚段(Rollback segment),InnoDB是索引组织表,数据段就是B+树的叶子节点,索引段即为B+树的非叶子节点。段用来管理多个Extent(区)。
区(Extent):表空间的单元结构,每个区的大小为1M, 默认情况下,InnoDB存储引擎页大小为16k,即一个区中一共有64个连续的页
页(Page):页是InnoDB存储引擎磁盘管理的最小单元,每个页大小默认为16K,为了保证页的连续,InnoDB存储引擎每次从磁盘申请4-5个区
行(Row):InnoDB存储引擎数据是按行进行存放的,Trx_id:每次对某条记录进行改动时,都会把对应的事务id赋值给这个trx_id隐藏列。Roll_pointer:每次对某条记录进行改动时,都会把旧的版本写入到undo日志中,然后这个隐藏列就相当于一个指针,通过它可以找到该记录修改前的信息
二、整体架构
MySQL5.5 版本开始,默认使用 InnoDB 存储引擎,它擅长事务处理,具有崩溃恢复特性,在日常开发中使用非常广泛,下面是 InnoDB 架构图,左侧为内存架构,右侧为磁盘架构。
三、内存结构
内存架构中主要分为:Buffer Poll(内存缓冲池)、Change Buffer()、LogBuffer()、Adaptive Hash Index()四个区。
3.1 Buffer Pool
缓冲池是主内存中的一个区域,里面可以缓存磁盘上经常操作的真实数据,在执行增删改查操作时,先操作缓冲池中的数据,若缓冲池没有数据,则从磁盘加载并缓存,然后再以一定频率刷新到磁盘,从而减少磁盘IO,加快出来速度。缓冲池以Page页为单位,底层采用链表数据结构管理Page,根据状态可以将Page分为三种类型。
- free page:空闲Page,未被使用。
- clean page:被使用page,数据没有被修改过。
- dirty page:脏页,被使用page,数据被修改过,其中数据与磁盘上的数据产生了不一致。
3.2 Change Buffer
更改缓冲区,针对与非唯一二级索引页,在执行DML语句时,如果这些数据Page没有在Buffer Pool中,不会直接操作磁盘,而是将数据变更存在更改缓冲区Change Buffer中,在未来数据被读取时,再将数据合并恢复到Buffer Pool中,再讲合并后的数据刷新到磁盘中。
Change Buffer的意义:与集聚索引不同,二级索引通常是非唯一的,并且以相对随机的顺序插入二级索引,同样,删除和更新都可能会影响索引树中不相邻的二级索引页,如果每一次都操作磁盘,会造成大量的磁盘IO,有了Change Buffer之后,我们可以在缓冲池中进行合并处理,减少磁盘IO
3.3 Adaptive Hash index
自适应hash索引,InnoDB默认是不支持hash索引的,默认支持的是B+树的索引。因为hash索引不支持范围查找,仅可以用来做值匹配查找。但是自适应hash索引,用于优化对Buffer Pool数据的查询。InnoDB存储引擎会监控对表上各项索引页的查询,如果观察到hash索引可以提升速度,则建立hash索引,称之为自适应hash索引。
自适应哈希索引,无需人工干预,是系统根据情况自动完成。通过 innodb_adaptive_hash_index 参数可以配置自适应hash索引的开启和关闭。
mysql> show variables like "%innodb_adaptive_hash_index%";
+----------------------------------+-------+
| Variable_name | Value |
+----------------------------------+-------+
| innodb_adaptive_hash_index | ON |
| innodb_adaptive_hash_index_parts | 8 |
+----------------------------------+-------+
2 rows in set (0.00 sec)
3.4 Log Buffer
日志缓冲区,用来保存要写入到磁盘中的log日志(redolog,undolog),默认大小为16M, 日志缓冲区的日志会定期刷新到磁盘中,如果需要更新、插入或者删除许多行的事务,增加日志缓冲区的大小可以节省磁盘i/o
通过 innodb_log_buffer_size 参数可以查看缓冲区大小
通过 innodb_flush_log_at_trx_commit 参数可以查看刷新到磁盘时机。这里有0,1,2三个值:
- 0:每秒将日志写入并刷新到磁盘一次。
- 1:日志在每次事务提交时写入并刷新到磁盘。
- 2:日志在每次事务提交后写入,并每秒刷新到磁盘一次。
mysql> show variables like "innodb_log_buffer_size";
+------------------------+----------+
| Variable_name | Value |
+------------------------+----------+
| innodb_log_buffer_size | 16777216 |
+------------------------+----------+
1 row in set (0.00 sec) mysql> show variables like "%flush_log%";
+--------------------------------+-------+
| Variable_name | Value |
+--------------------------------+-------+
| innodb_flush_log_at_timeout | 1 |
| innodb_flush_log_at_trx_commit | 1 |
+--------------------------------+-------+
2 rows in set (0.00 sec)
四、磁盘架构
4.1 System Tablespace
在MySQL中,System Tablespace(系统表空间)是一个用于存储系统表和一些特殊表的默认表空间。系统表空间包含了以下几个重要的系统表:
- mysql.user:存储了MySQL中的用户和权限信息。
- mysql.db:存储了所有数据库的信息。
- mysql.host:存储了允许连接到MySQL服务器的主机信息。
- mysql.tables_priv:存储了表级别的权限信息。
- mysql.columns_priv:存储了列级别的权限信息。
系统表空间还包含其他系统表,用于存储MySQL服务器的配置和元数据信息。
系统表空间默认存储在名为`ibdata1`的共享文件中。这个文件通常位于MySQL的数据目录下。
要注意的是,在InnoDB存储引擎中,除了系统表空间(System Tablespace),还存在一个叫做表空间文件(Tablespaces)的概念。表空间文件用于存储用户创建的表和索引。每个InnoDB表都会有一个对应的表空间文件。
需要注意的是,有时候系统表空间的大小会超过预期,导致空间不足或性能问题。在这种情况下,可以考虑调整系统表空间的大小或进行其他优化措施以解决问题。
总结:系统表空间是MySQL中用于存储系统表和特殊表的默认表空间,包含了一些重要的系统表,通常存储在名为`ibdata1`的共享文件中。
4.2 File-Per-Table Tablespace
File-Per-Table Tablespace(每个表一个表空间)是MySQL中的一个存储配置选项,它允许每个InnoDB表使用单独的表空间文件来存储数据和索引。这与默认情况下的系统表空间不同。
在默认情况下,所有的InnoDB表共享一个系统表空间,即存储在ibdata1
文件中。而使用File-Per-Table Tablespace选项,每个InnoDB表都会有一个独立的表空间文件,位于数据目录下。
File-Per-Table Tablespace的优点包括:
- 管理:每个表有自己的表空间文件,方便管理和维护。可以更方便地备份、恢复或迁移单个表。
- 性能:每个表具有独立的表空间文件,可以在磁盘上更好地分布和组织数据,提高性能和并发访问的能力。
- 存储空间:使用File-Per-Table Tablespace可以更有效地使用存储空间。当有大量小表或经常进行删除和重建表时,每个表的表空间文件可以更好地管理空间,避免系统表空间的不断增长。
File-Per-Table Tablespace的缺点和注意事项包括:
- 管理复杂性:每个表都会有一个独立的表空间文件,这可能增加了管理的复杂性,包括备份和维护的管理操作。
- 存储和文件系统:使用File-Per-Table Tablespace可能涉及更多的磁盘IO操作,并可能增加文件系统的碎片化问题。
使用File-Per-Table Tablespace可以在创建表时进行配置或在现有表上进行更改。要在创建新表时启用File-Per-Table Tablespace,可以在创建表的DDL语句中加上ENGINE=InnoDB
选项。要在已有表上启用File-Per-Table Tablespace,可以使用MySQL的ALTER TABLE
语句并设置innodb_file_per_table
参数为ON。
总结:File-Per-Table Tablespace是MySQL InnoDB存储引擎的一个选项,允许每个表使用单独的表空间文件存储数据和索引。它提供了更灵活的管理、更好的性能和更高效的存储空间利用率
4.3 General Tablespaces
General Tablespaces(通用表空间)是MySQL 5.7版本引入的一个功能,在InnoDB存储引擎中提供了更灵活和更高级的表空间管理选项。
通用表空间允许将多个InnoDB表存储在一个或多个共享表空间文件中,而不是每个表都有自己的独立表空间文件(如File-Per-Table Tablespace中)。这些共享表空间文件可以在运行时动态添加或删除新的表。
通用表空间的优点包括:
- 简化管理:使用通用表空间可以更方便地管理和维护多个表。可以将相关的表组织在同一个共享表空间中,便于备份、恢复和迁移。
- 空间效率:通用表空间可以更有效地使用存储空间。多个表可以共享一个表空间文件,避免了为每个表都创建单独的表空间文件的开销。
- 高性能:由于多个表共享表空间文件,可以提高磁盘IO操作的效率。此外,共享表空间可以利用预读机制(预读相邻页)来提高查询性能。
使用通用表空间时,可以在创建表时指定TABLESPACE
子句来为表分配到指定的共享表空间,也可以使用ALTER TABLE
语句将现有表移动到共享表空间中。
创建通用表空间示例:
mysql> create tablespace my_test add datafile "my_test.ibd" engine=InnoDB;
Query OK, 0 rows affected (0.01 sec)
创建使用通用表空间的表示例:
mysql> create table tablespace_test(id int) tablespace my_test;
Query OK, 0 rows affected (0.03 sec)
说明1:此时MySQL就不会再给tablespace_test表创建单独的表空间了,而是使用通用表空间my_test.ibd空间
将现有表移动到通用表空间语法示例:
ALTER TABLE table_name TABLESPACE tablespace_name;
说明2:`table_name`是要移动的表的名称,`tablespace_name`是要移动到的表空间的名称。
删除通用表空间语法示例
ALTER TABLESPACE tablespace_name DROP DATAFILE '<path>/tablespace_file.ibd';
说明3:`tablespace_name`是要删除的表空间的名称,`<path>/tablespace_file.ibd`是要删除的表空间文件的路径和文件名。
4.4 undo Tablespace
在MySQL中,"undo tablespace"(撤销表空间)是用于存储撤销日志数据的一种特殊类型的表空间。
撤销日志是 MySQL 中的一项重要功能,用于回滚或撤销事务中所做的更改。当事务执行 UPDATE、DELETE 或 INSERT 操作时,撤销日志记录了被修改或删除的非聚集索引的旧值,以及 INSERT 操作插入的新记录。这些撤销日志记录存储在名为 "undo log" 的数据结构中。
为了高效地管理和存储撤销日志数据,MySQL引入了 "undo tablespace" 的概念。撤销表空间是一个独立于数据表空间的区域,用于存储撤销日志数据。它可以包含一个或多个文件,这些文件具有固定大小(通常是小于等于1GB)和特定的命名约定,默认的是undo_001和undo_002
撤销表空间的主要作用有以下几个方面:
- 提供事务的回滚能力:如果一个事务需要回滚,MySQL可以使用撤销表空间中的撤销日志来还原事务执行前的数据状态。
- 支持并发事务:撤销表空间使得多个事务可以同时进行,并提供了事务隔离级别的支持。
- 回收空间:当事务完成时,撤销表空间中的撤销日志可以被清除,空间可以被重复使用。
撤销表空间在MySQL的配置文件(my.cnf或my.ini)中通过innodb_undo_directory
和innodb_undo_tablespaces
配置项进行设置。innodb_undo_directory
定义了撤销表空间文件的存储目录,而innodb_undo_tablespaces
指定了要使用的撤销表空间文件的数量。
总结:撤销表空间是MySQL中用于存储撤销日志数据的表空间,支持事务的回滚、并发事务和空间回收。
4.5 Temporary Tablespace
在MySQL中,临时表空间(Temporary Tablespace)是用于存储临时表数据和临时结果集的一种特殊类型的表空间。临时表空间的作用是存储临时表的数据,这些临时表通常是在查询过程中创建的。这些临时表可能包括临时表名、中间结果集或者用于排序和聚合的临时数据。
默认情况下,MySQL使用系统表空间(system tablespace)来存储临时表数据。但是,在高并发环境下,使用单个系统表空间可能会导致性能瓶颈。为了提高性能并优化系统资源的使用,MySQL引入了临时表空间的概念。通过为临时表数据分配独立的临时表空间,MySQL可以更好地管理和优化临时表的创建和使用。临时表空间可以在独立的表空间文件中存储临时表数据,这些文件可以位于不同的存储设备上,从而分散了IO负载。
可以通过以下配置项来设置临时表空间:既可以写在MySQL配置文件中也可以在MySQL交互界面上使用set 指令设置
-`tmp_table_size`:用于设置每个临时表的内存大小。如果临时表大小超过此值,则会将其存储到临时表空间中。
-`max_heap_table_size`:用于设置只在内存中存储的临时表的最大大小。
-`tmpdir`:用于设置临时表空间的目录。
使用临时表空间可以提升查询性能,减少对系统表空间的负载,并提供更好的系统扩展性和可维护性。
总结:临时表空间是MySQL中用于存储临时表数据和临时结果集的表空间。它可以提高查询性能,并分散IO负载,提供更好的系统资源利用和扩展性。
4.6 Doublewrite Buffer Files
4.7 Redo Log
在MySQL中,Redo Log(重做日志)是用于实现事务的持久性和恢复能力的关键组件之一。它记录了发生在数据库中的数据更改操作,以确保在系统崩溃或断电时,能够将未完成的事务重新应用到数据库中,以保持数据的一致性。
Redo Log是循环写入的,意味着当日志文件写满后,会重新从开头开始覆盖之前的日志。所有的修改操作都会先写入到Redo Log,然后异步地刷新到磁盘上的数据文件。这样即使在写操作还未刷新到磁盘上的数据文件时发生崩溃,通过Redo Log的回放可以重新执行未完成的事务,确保数据的持久性。
Redo Log是以逻辑方式记录的,而不是物理方式。它记录了事务引起的数据修改,而不是实际的数据变化。通过记录这些逻辑操作,MySQL可以在恢复时重新执行所需的操作。
在MySQL中,Redo Log由两个文件组成,通常为`ib_logfile0`和`ib_logfile1`。这些文件的大小由配置参数`innodb_log_file_size`控制,默认情况下为`48MB`。可以在MySQL配置文件中进行修改。
使用Redo Log的一个重要注意事项是,写入Redo Log会引起磁盘IO操作,因此对于事务密集型负载,合理调整Redo Log的大小和I/O性能是很重要的。过小的Redo Log可能导致频繁的刷新和IO延迟,而过大的Redo Log可能对内存和磁盘空间带来负担。
总结:Redo Log是MySQL中用于实现事务的持久性和恢复的关键组件,它记录了数据的修改操作,保证在系统崩溃或断电后,能够重新应用未完成的事务。Redo Log由两个文件组成,通过循环写入的方式记录数据修改。合理调整Redo Log的大小和I/O性能对于数据库性能和持久性是重要的。
MySQL高级10-InnoDB引擎存储架构的更多相关文章
- MySql锁与InnoDB引擎
MySql锁与InnoDB引擎 mysql的锁是面试中很高频问题,也是我们在日常开发中经常会遇到但是我们并没有注意到的地方.我把我自己理解的锁通过本篇博文分享出来,由于锁需要结合事务来理解,本文只介绍 ...
- Mysql优化系列--Innodb引擎下mysql自身配置优化-转
原文链接:http://www.cnblogs.com/kevingrace/p/6133818.html 谢谢楼主 1.简单介绍 InnoDB给MySQL提供了具有提交,回滚和崩溃恢复能力的事务安全 ...
- InnoDB引擎体系架构
InnoDB引擎架构介绍 innodb存储引擎的体系架构,可简单划分成三层: 数据文件 :磁盘上的数据文件 内存池:缓存磁盘上的数据,方便读取,同时在对磁盘文件数据修改之前在这里缓存,然后按一定规刷新 ...
- MySQL文件和Innodb引擎文件
构成MySQL数据库和InnoDB存储引擎表的各种类型文件,组要有以下文件 参数文件:告诉MySQL实例启动时在哪里可以找到,数据库文件,并且指定某些初始化参数,这些参数定义了某种内存结构的大小等设置 ...
- 查看MySQL是否支持InnoDB引擎以及不支持的解决办法
通过命令行进入mysql SHOW variables like "have_%"; 显示结果中会有如下3种可能的结果: have_innodb YES have_innodb N ...
- 转 使用HAProxy,PHPRedis,和MySQL支撑10亿请求每周架构细节
[编者按]在公司的发展中,保证服务器的可扩展性对于扩大企业的市场需要具有重要作用,因此,这对架构师提出了一定的要求.Octivi联合创始人兼软件架构师Antoni Orfin将向你介绍一个非常简单的架 ...
- MySQL中innodb引擎分析(初始化)
MySQL的存储引擎是以插件形式工作的,这应该是MySQL的一大特色了吧! 依据<深入理解MySQL>的内容,5.1版本号时存储引擎的插件化都还不是彻底,确切的说是刚加入的特性.为MySQ ...
- MySQL InnoDB引擎B+树索引简单整理说明
本文出处:http://www.cnblogs.com/wy123/p/7211742.html (保留出处并非什么原创作品权利,本人拙作还远远达不到,仅仅是为了链接到原文,因为后续对可能存在的一些错 ...
- mysql之InnoDb引擎与MyISAM引擎对比
InnoDb引擎 支持ACID的事务,支持事务的四种隔离级别: 支持行级锁及外键约束:因此可以支持写并发: 不存储总行数: 一个InnoDb引擎存储在一个文件空间(共享表空间,表大小不受操作系统控制, ...
- MySQL 8.0 InnoDB新特性
MySQL 8.0 InnoDB新特性 1.数据字典全部采用InnoDB引擎存储,支持DDL原子性.crash safe,metadata管理更完善 2.快速在线加新列(腾讯互娱DBA团队贡献) 3. ...
随机推荐
- MySQL中字符串查询效率大比拼
背景 最近有个同事对字符串加索引,加完后,发现多了个奇奇怪怪的数字执行的SQL如下: alter table string_index_test add index `idx_name` (`name ...
- ORM核心功能之导航属性- EFCore和 SqlSugar
导航属性 导航属性是作为ORM核心功能中的核心,在SqlSugar没有支持导航属性前,都说只是一个高级DbHelper, 经过3年的SqlSugar重构已经拥有了一套 非常成熟的导航属性体系,本文不是 ...
- cmd+ssh配置远程服务器Anaconda3_2023+pytorch
一.上传Anaconda3到远程服务器 注意:如果要将这个东西安装在anaconda3文件夹里的话,当前这个目录里不能有这个文件夹.(安的时候会自动创建) 二.安装Anaconda3 1. win+r ...
- Python初学者友好丨详解参数传递类型
摘要: 本文清晰地解释了Python中的不同参数传递类型,并提供了示例代码来说明每种类型的用法.对于初学者或不清楚Python传参的读者们来说是非常有益的,文中提供了足够的信息来理解和使用Python ...
- CKS 考试题整理 (08)-Pod指定ServiceAccount
Context 您组织的安全策略包括: ServiceAccount 不得自动挂载 API 凭据 ServiceAccount 名称必须以 "-sa" 结尾 清单文件 /cks/s ...
- C++ Tips of the Week-01 string_view
1: string_view ref https://abseil.io/tips/1 函数参数需要是一个字符串的时候,通常的实现有以下几种: // C Convention void TakesCh ...
- Linux下Redis集群部署
一.Redis集群介绍 Redis 集群是一个提供在多个Redis节点间共享数据的程序集.Redis集群并不支持处理多个keys的命令,因为这需要在不同的节点间移动数据,从而达不到像Redis那样的性 ...
- Unity的Console的控制类LogEntries:深入解析与实用案例
使用Unity Console窗口的LogEntries私有类实现自定义日志系统 在Unity开发过程中,我们经常需要使用Console窗口来查看程序运行时的日志信息.Unity内置的日志系统提供了基 ...
- webshell工具流量特征
常见的webshell管理工具及流量特征 菜刀 作为老牌 Webshell 管理神器,中国菜刀的攻击流量特征明显,容易被各类安全设备检测,实际场景中越来越少使用,加密 Webshell 正变得日趋流行 ...
- Linux 概念:u-boot
U-Boot介绍 参考:https://baike.baidu.com/item/U-Boot/10377075 参考:https://u-boot.readthedocs.io/en/latest/ ...