Mysql优化(出自官方文档) - 第十篇(优化InnoDB表篇)
Mysql优化(出自官方文档) - 第十篇(优化InnoDB表篇)
- Mysql优化(出自官方文档) - 第十篇(优化InnoDB表篇)
- 1 Optimizing Storage Layout for InnoDB Tables
- 2 Optimizing InnoDB Transaction Management
- 3 Optimizing InnoDB Transaction Management
- 4 Optimizing InnoDB Redo Logging
- 5 Bulk Data Loading for InnoDB Tables
- 6 Optimizing InnoDB Queries
- 7 Optimizing InnoDB DDL Operations
- 8 Optimizing InnoDB Disk I/O
- 9 Optimizing InnoDB Configuration Variables
- 10 Optimizing InnoDB for Systems with Many Tables
1 Optimizing Storage Layout for InnoDB Tables
如果一个表的大小已经变得非常大了(M级别),那么使用
OPTIMIZE TABLE
对表进行重组织和合并浪费的空间,该命令会拷贝表中的部分数据和重建索引。在
InnoDB
中,如果PRIMARY KEY
很长,会浪费非常多的空间,因为primary key
会在每一个二级索引中拷贝一次,这个时候,请考虑创建一个AUTO_INCREMENT
列作为primary key
或者使用VARCHAR
的一部分作为primary key
。使用
VARCHAR
来代替CHAR
类型列,因为VARCHAR
占用更小的空间,CHAR(N)
类型占用空间最少为N
个字符,无论长度小于N或者为NULL
。如果一个表中存储着大量的数字或者重复文本,考虑使用
COMPRESSED
格式。
2 Optimizing InnoDB Transaction Management
如果一个事务只包含
SELECT
语句,那么,打开AUTOCOMMIT
能够协助InnoDB
识别只读事务从而优化它们。如果有一个很大的事务,包含巨量的数据更改删除操作,此时如果发生回滚,将会导致Mysql性能非常的糟糕,所以应该尽量避免回滚的发生。如果无法避免,可采取下面的措施来加快回滚操作速度:
- 增加
buffer pool
的大小,这样子数据操作就可以缓存在内存中,而不需要频繁写入磁盘,从而减少磁盘I/O - 设置
innodb_change_buffering=all
,这样子除了insert
操作外,update
和delete
操作也可以被缓存 - 定时
COMMIT
,或者拆分大的事务。
经过上面的操作,可以让
rollback
操作变为CPU-bound
型操作,能够大幅度加快处理速度。- 增加
如果一个长事务在修改表,那么该表上面的其他事务将无法使用
covering index
技术,只能使用二级索引来获取对应的列。如果一个二级索引的
PAGE_MAX_TRX_ID
较新,或者一个二级索引对应的记录被标记为DELETED
,InnoDB
可能使用聚集索引来查找对应的记录。
3 Optimizing InnoDB Transaction Management
InnoDB
会避免为只读事务创建transaction ID(TRX_ID field)
,因为一个transaction ID
只有当进行写操作,或者类似于SELECT ... FOR UPDATE
这样的语句时才会有用。对于只读事务,消除transaction ID
能够减少内部数据结构的大小。
InnoDB
是通过下面的方式来识别只读事务的:
- 一个事务以
START TRANSACTION READ ONLY
开头,在这样的事务下,任何更改数据库的操作都会抛出错误。 autocommit
被打开,此时,一个单独的语句都会被视为一个事务,所以对于那些不带FRO UPDATE
或者LOCK IN SHARED MODE
的SELECT
语句,将会被视为只读事务。- 事务没有
READ ONLY
,但是同样的没有UPDATE
或者lock rows
的操作,此时,InnoDB
会视该事务为只读,后面一旦有了UPDATE
或者lock rows
操作,那么,该事务将不再处于只读状态。
4 Optimizing InnoDB Redo Logging
配置
redo log
的文件大小和buffer pool
一样大,虽然较大的redo log
可能会导致较长时间的recovery
,但是目前的recovery
速度非常快,所以可以配置较大的redo log
。通过innodb_log_file_size
andinnodb_log_files_in_group
两个参数可以进行对应的配置。考虑增大 log buffer, 较大的
log buffer
可以避免事务在commit
进行日志的磁盘I/O。通过innodb_log_buffer_size
可进行配置。配置合适的
innodb_log_write_ahead_size
的值可以避免文件的"read-on-write"
,配置的过小,可能会导致操作系统或者文件系统频繁的进行"read-on-write"
,配置过大可能会影响fsync
的效率,因为会导致过多的磁盘block
读写。尽量配置该值和操作系统,文件系统的cache block size
相匹配。优化用户线程等待
flushed redo
的spin delay
,在高并发场景下将会特别有用,通过下面几个变量可以优化spin delay
,这里不再进行赘述。innodb_log_wait_for_flush_spin_hwm
,innodb_log_spin_cpu_abs_lwm
和innodb_log_spin_cpu_pct_hwm
5 Bulk Data Loading for InnoDB Tables
这些技巧只是对INSERT
技巧的一个简单补充:
当导入数据到
InnoDB
中时,关闭autocommit
,因为autocommit
会导致每一个insert
都进行flush log
操作。如果在二级索引上面有
UNIQUE
约束,那么可以临时关闭uniqueness checks
,这样子可以省略Mysql检查unique
的开销,但是**必须要自己保证数据中没有重复key**
。SET unique_checks=0;
... SQL import statements ...
SET unique_checks=1;
如果表上面有外键约束,那么可以临时关闭外键检查来加快速度,对于大表来讲,会减少大量的磁盘I/O,但是同时需要保证外键的正确性。
SET foreign_key_checks=0;
... SQL import statements ...
SET foreign_key_checks=1;
使用
INSERT
插入多行的语法,可以减少server
和client
之间的网络开销。如果表中有
AUTO-INCREMENT
列,设置innodb_autoinc_lock_mode
为2(interleaved
)(默认是1(consecutive
))对于批量插入操作,按照
PRIMARY KEY
顺序进行插入的速度要更快当
loading
数据到一个带有FULLTEXT
索引的表中,采用下面的步骤可以优化插入下利率:在创表的时候,创建一个
BIGINT UNSIGNED NOT NULL
,名为FTS_DOC_ID
的列,并且在上面创建一个FTS_DOC_ID_INDEX
的唯一索引,举例如下:CREATE TABLE t1 (
FTS_DOC_ID BIGINT unsigned NOT NULL AUTO_INCREMENT,
title varchar(255) NOT NULL DEFAULT '',
text mediumtext NOT NULL,
PRIMARY KEY (`FTS_DOC_ID`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
CREATE UNIQUE INDEX FTS_DOC_ID_INDEX on t1(FTS_DOC_ID);
loading
数据到表中当数据
load
完成之后,创建索引。
NOTE:
当创建
FTS_DOC_ID
列的时候,确保当FULLTEXT
索引列被更新的时候,FTS_DOC_ID
也会被更新。如果不创建该列,那么InnoDB
会隐式的管理DOC ID
,InnoDB
会在调用CREATE FULLTEXT INDEX
的时候添加一个FTS_DOC_ID
隐藏列,因为执行该操作,需要重建表,此时会较大的影响性能。
6 Optimizing InnoDB Queries
- 因为
InnoDB
无论如何都会创建primary key
,所以显式选择一些会被高频访问的列作为primary key
- 不要创建包含过多或者过长列作为
primary key
,primary key
会在每个二级索引中复制一遍。 - 如果某列不可能为
NULL
,那么声明为NOT NULL
7 Optimizing InnoDB DDL Operations
- 当
loading
数据的时候,如果没有二级索引,速度将会大大提升,因此,尽量在loading
完数据后再创建二级索引。 - 如果需要删除表中的所有数据,使用
TRUNCATE TABLE
来取代DELETE FROM *tbl_name*
。同理,DROP TABLE
andCREATE TABLE
的效率也会比普通的DELETE FROM
要高很多。 InnoDB
表是由primary key
进行组织的,所以修改primary key
的定义会导致整张表都被重新组织,开销较大,因此,尽量不要去修改primary key
的定义,在创建表的时候就指定好。
8 Optimizing InnoDB Disk I/O
如果发现CPU的利用率不足70%,那么很有可能是因为磁盘到了瓶颈,可以采取下面的优化方式:
增加
buffer pool
的大小,一般配置为系统内存的50%-75%
修改
flush
函数,InnoDB
默认为fsync
,但是在有些系统上这种类似的函数会非常慢,因此通过innodb_flush_method
进行相应的调整。为
write buffer
设置一个threshold size
,通过设置innodb_fsync_threshold
参数可以配置write buffer
在多大的时候才进行flush
操作,可以减少一定的磁盘I/O在
linux AIO
上,使用noop
或者deadline I/O
调度方式,通过innodb_use_native_aio
可进行对应的配置。在
Solaris 10
上面的x86_64
架构使用direct I/O
在
Solaris 2.6
或者之后的版本,使用row storage
来存储数据和日志文件考虑使用非旋转存储介质,比如ssd这种,非旋转存储设备的随机读写性能要远高于传统存储设备,对于Mysql,通常来讲,面向随机I/O的文件包括: file-per-table and general tablespace data files, undo tablespace files, and temporary tablespace files,而面向顺序写I/O的文件包括:
InnoDB
system tablespace files (due to doublewrite buffering and change buffering) and log files such as binary log files and redo log files。通过配置下面的参数可以提高非旋转存储介质的效率:
innodb_checksum_algorithm
,innodb_flush_neighbors
,innodb_io_capacity
,innodb_io_capacity_max
,innodb_log_compressed_pages
,innodb_log_file_size
,innodb_page_size
andbinlog_row_image
增加
I/O capacity
从而避免backlogs
,如果性能出现较大范围的波动(因为InnoDB
进行checkpoint
的缘故),考虑增加innodb_io_capacity
参数,该值越大,flush
的频率也会越高,就可以避免较多的backlog
操作。如果
flushing
没有落后的话,那么尝试适当降低I/O capacity
, 但是不要过低,过低的I/O capacity
会导致性能抖动。将系统
tablespace files
存储在Fusion-io
设备上,因为这种设备支持原子写操作,因此,当使用这种设备的时候,doublewrite buffering
(innodb_doublewrite
) 会自动禁用以提高性能。禁用
compressed pages
的日志,通过innodb_log_compressed_pages
系统变量进行控制,默认情况是启用的,这是为了防止在恢复的时候,使用了不同的zlib
算法,会导致mysql
挂掉,如果你确定不会使用不同的zlib算法,那么可以禁用该项来提高效率。
9 Optimizing InnoDB Configuration Variables
本小节主要提供一些优化InnoDB
效率的手段,由于条数较多,且有很多在上文已经提到过,所以这里仅挑选一些重要的条目列出来:
- 对于
InnoDB
的线程数进行一个限制,过高的线程并发可能会导致上下文切换开销较大。 - 对于
read-ahead
操作,控制prefetching
的数量,因为过多的read-ahead
会导致性能抖动,详情可以看InnoDB
的Buffer Pool Prefetching
技术。 - 控制
InnoDB
后台的I/O
量,过多的后台I/O
会导致性能抖动,主要通过master thread
来配置。 - 调整后台写的算法,不同的算法适应不同的场景,详情可通过
Buffer Pool Flushing
来配置。 - 尽可能的利用多核处理器和其缓存内存的优势,这样子可以减小上下文的时延,详情可通过配置
Spin Lock Polling
来实现。 - 避免单词操作如
table scan
,对buffer pool
中高频访问数据的干扰,可通过配置Buffer Pool
的一些淘汰算法来实现。 - 在以前版本的
Mysql
(指Mysql.5.5
之前)中,为了避免系统因为恢复启动时间过长,通常会将log
的大小设置的较小。在现在的版本中,通过redo log
的恢复流程被大大优化,现在可以考虑适当增大redo log
的大小了,因为这样子可以减少I/O - 对于拥有较大内存的机器,调整
buffer pool
的实例数和大小;增加事务并发的最大数量,可以大幅度的提升业务量大的数据库的拓展性,在Undo logs
的介绍中有介绍原因。 - 将
purge
线程设置为后台线程。 - 为了避免频繁的线程上下文切换,在现代机器上,可将
innodb_thread_concurrency
配置到32,innodb_concurrency_tickets
配置5000,通过这两个参数,每个线程就可以在被换出前做尽可能多的事情。
10 Optimizing InnoDB for Systems with Many Tables
如果配置了 non-persistent optimizer statistics(非默认设置),
InnoDB
会在启动后且当该表第一次被访问的时候计算index [cardinality
](https://dev.mysql.com/doc/refman/8.0/en/glossary.html#glos_cardinality)的值,这个过程非常耗时,但是只有第一次open table
的时候才会做,后面的访问将不会做这样的事情,为了提前给table“热身”,可以使用SELECT 1 FROM *tbl_name* LIMIT 1
这样的语句来触发。可通过
innodb_stats_persistent
参数来配置优化数据是否需要持久化。
Mysql优化(出自官方文档) - 第十篇(优化InnoDB表篇)的更多相关文章
- Mysql优化(出自官方文档) - 第十二篇(优化锁操作篇)
Mysql优化(出自官方文档) - 第十二篇(优化锁操作篇) 目录 Mysql优化(出自官方文档) - 第十二篇(优化锁操作篇) 1 Internal Locking Methods Row-Leve ...
- Mysql优化(出自官方文档) - 第三篇
目录 Mysql优化(出自官方文档) - 第三篇 1 Multi-Range Read Optimization(MRR) 2 Block Nested-Loop(BNL) and Batched K ...
- Mysql优化(出自官方文档) - 第五篇
目录 Mysql优化(出自官方文档) - 第五篇 1 GROUP BY Optimization 2 DISTINCT Optimization 3 LIMIT Query Optimization ...
- Mysql优化(出自官方文档) - 第八篇(索引优化系列)
目录 Mysql优化(出自官方文档) - 第八篇(索引优化系列) Optimization and Indexes 1 Foreign Key Optimization 2 Column Indexe ...
- Mysql优化(出自官方文档) - 第九篇(优化数据库结构篇)
目录 Mysql优化(出自官方文档) - 第九篇(优化数据库结构篇) 1 Optimizing Data Size 2 Optimizing MySQL Data Types 3 Optimizing ...
- Mysql优化(出自官方文档) - 第七篇
Mysql优化(出自官方文档) - 第七篇 目录 Mysql优化(出自官方文档) - 第七篇 Optimizing Data Change Statements 1 Optimizing INSERT ...
- Mysql优化(出自官方文档) - 第六篇
Mysql优化(出自官方文档) - 第六篇 目录 Mysql优化(出自官方文档) - 第六篇 Optimizing Subqueries, Derived Tables, View Reference ...
- Mysql优化(出自官方文档) - 第四篇
Mysql优化(出自官方文档) - 第四篇 目录 Mysql优化(出自官方文档) - 第四篇 1 Condition Filtering 2 Constant-Folding Optimization ...
- Mysql优化(出自官方文档) - 第二篇
Mysql优化(出自官方文档) - 第二篇 目录 Mysql优化(出自官方文档) - 第二篇 1 关于Nested Loop Join的相关知识 1.1 相关概念和算法 1.2 一些优化 1 关于Ne ...
随机推荐
- SAP ABAP ALV 颜色设置(两个ALV函数例子) 列 行 单元格
@[TOC](设置ALV颜色)# 前言淦! 要求花花绿绿的ALV ,那就淦他! 需要的参数和对应颜色放在最后.稍微改改就能用. 介绍两个常用的ALV函数实现1.REUSE_ALV_GRID_DISPL ...
- c++中new[ ]与delete[ ]的分析
前言 以前对c++的new[]的了解就是开辟一块内存,直到我最近在程序中用到它才发现我的了解太浅. 问题分析 new[]得到的内存空间不会自动初始化 new[]是在堆区中动态分配指定大小的内存,但是这 ...
- Java 反编译工具哪家强?对比分析瞧一瞧
前言 Java 反编译,一听可能觉得高深莫测,其实反编译并不是什么特别高级的操作,Java 对于 Class 字节码文件的生成有着严格的要求,如果你非常熟悉 Java 虚拟机规范,了解 Class 字 ...
- Linux 操作系统(一)命令&用户&权限
以下实例均在Centos7下验证 Centos7 查看命令帮助 man xxx 常用命令 ls / cd - #切到上次目录 cd #回家 cat cat f1 f2 cat f1 f2>f3 ...
- 攻防世界(四)php_rce
攻防世界系列:php_rce 1.打开题目 看到这个还是很懵的,点开任意连接都是真实的场景. 2.ThinkPHP5,这里我们需要知道它存在 远程代码执行的漏洞. ?s=index/\think\ap ...
- stm32之ADC应用实例(单通道、多通道、基于DMA)-转载精华帖,最后一部分的代码是精华
硬件:STM32F103VCT6 开发工具:Keil uVision4 下载调试工具:ARM仿真器网上资料很多,这里做一个详细的整合.(也不是很详细,但很通俗).所用的芯片内嵌3个12位的 ...
- 为何存在uwsgi还要使用nginx
nginx是对外的服务接口,外部浏览器通过url访问nginx,nginx接收到浏览器发送过来的http请求,将包解析分析url,如果是静态文件则直接访问用户给nginx配置的静态文件目录,直接返回用 ...
- 处理SpringMVC中遇到的乱码问题
乱码在日常开发写代码中是非常常见的,以前乱码使用的是通过设置一个过滤器解决, 现在可以使用SpringMVC给提供的过滤器,在web.xml设置,这比我们自己写的过滤器强大的的多. 注意:每次修改了x ...
- Ansible学习分享(基本)
背景:Teamleader提到一款好用的自动化配置管理工具,于是前去学习实践,有了下面分享. 纲要 一.Ansible简介 二.Ansible准备 2.1 Ansible安装 2.2 设置SSH公钥验 ...
- newbee-mall开源项目被慕课网拿去做课程,然后我毫不知情,这又是什么骚操作?
万万没想到,这种事情会发生在我身上. 之前写过<开源囧事>系列而且已经写了四篇,四次开源囧事如下: <开源囧事(一)捅娄子了,写个bug被国家信息安全漏洞共享平台抓到了?> & ...