读高性能Mysql摘要
类型相关
INT(1)和INT(20)对于存储和计算来说,意义是相同的,他不会限制值的合法范围,只是一些交互工具会用来显示字符的个数
默认是有符号的,可以指定为无符号,增加数据存储范围,如0-255,可以声明unsigned
整数比字符操作代价更低,因为字符集和校对规则使字符更复杂,如果是ip,也应该用整型存储
尽量避免NULL:如果查询中包含可能为null的列,对Mysql来说更难优化。它使索引、索引统计和值都比较复杂,可为NULL的列会使用更多的存储空间,当为Null的列表被索引时,每个索引记录需要一个额外的字节,尽量不为NULL列建索引【InnoDB例外,它使用单独的bit存储NULL值,对于很多值为NULL,少数非NULL有很好的空间效率】
char适合存储定长的值,它占用的存储空间固定
varchar适合存储可变长的值,由于值的长度可变,所以存储的空间不确定,当一个内存页无法容纳完varchar数据占用的空间时,innodb会分裂成两页
varchar适合:列的更新少,使用了复杂的字符集,每个字符使用不同的字节数存储时
varchar保存时占用空间 : 1-byte or 2 byte + data
BLOB、TEXT:
值太大时,Innodb会分配额外的存储区域,每个值在行内需要1到4个字节存储一个指针
Blob存储的二进制数据,没有排序规则和字符集
TIMESTAMP只能保存1970年到2038年,显示的值依赖当前的时区
Datetime从1001年到9999年,类似字符串,因此和时区无关
字符集相关
字符集:
unicdoe一个字符统一用2个字节来标识,不管是汉字还是英文字母,还是符号,因此空间会有浪费
utf-8是一种变长的编码方式,使用1-4个字节,当字符在ascii码范围,就用一个字节标识,一个中文字符占3个字节
utf-8是广义的unicode字符集的实现方案,他已经尽力节省了空间,但GBK这种字符集还在大行其道,因为GBK是为中文量身定制的,他的空间更少,只是只支持中文,其他文字如韩文,会乱码,因此特定场景下还是有优势的
优化操作
从行缓冲中将编码过的列转换成行数据结构的操作代价是很高的,所以,用什么字段,取什么字段
粗略的经验法则:单个查询关联的表在12个表以内
大表的alter table可能会很慢,Mysql执行大部分修改表结构操作的方法是用新的结构创建一张表,从旧表中插入所有数据,删除旧表,如果服务器内存不足,有很大可能会持续几个小时
聚簇索引
聚簇索引指的是数据行存放在索引的叶子页中,一个表只能有一个聚簇索引
如果一个索引包含了所有需要用到的值,就叫覆盖索引,对于innodb,可以避免对主键索引的二次查询,效率很高
聚簇索引:索引和数据在一起,数据在叶子节点上,非叶子节点不存存储数据,这就决定了一个表只会有一个聚簇索引,B+树结构,适合排序?
优点:访问同一页的不同行数据时,如果数据页已经被加载到内存中,就不用再访问磁盘了
缺点:插入或修改时,代价昂贵,可能导致内存页一分为二;同时建议使用int主键,如果有uuid或其他规则的字符串做主键,可能导致索引稀疏,查询慢
辅助索引:叶子节点存放的不是数据,而是主键id,所以使用辅助索引,会先查到主键id,再查找到数据页
BTree:非叶子节点上也有数据,适合随机检索,越靠近root,磁盘i/o时间越少,速度越快
有j个孩子的节点,恰好有j-1个关键字
红黑树:弱平衡二叉树,每个节点到叶子节点的高度相同,java TreeMap,因此查询效率相当,数据存在节点上(所有节点上都有数据)
B+树blog:https://www.cnblogs.com/dreamworlds/p/5398535.html
为什么不把b+树的真实数据放到非叶子节点:导致每个磁盘存放的数据变多,而磁盘容量大小有限,最终导致磁盘块数据增大,进而导致树的高度增高,树的高度增高后,一次索引查询的磁盘i/o次数变多,磁盘i/o是耗时操作!这实际提高了空间利用率
B+树查询效率稳定,还实现了range-query,扫描所有叶子节点就能扫描全库,这也是数据库使用它作为索引的数据结构的重要原因
mysql分区表
分区表并没有一个全局索引,索引只是在各个底层表上各自加上完全相同的索引,并且操作对程序是暗箱的,有一定风险
redo undo
Redo Log:记录已经commit但尚未写到磁盘的事务的最新数据,保证持久性
Undo Log:记录操作前的数据,方便崩溃回滚,在事务中想看到修改前的数据时,也会用到undo Log,undo log记录了修改前的数据
Innodb
Redo Log包含了Undo Log的内容、事务回滚时的操作
一个被回滚的事务,在恢复时,会先修改redo,再undo,因此不会破坏数据唯一性
==join原理
https://www.cnblogs.com/shengdimaya/p/7123069.html
innodb 特性
innodb会把>=768bytes的定长field转换可变长field,如char(255)可能存放超过768bytes数据,如utf8md4字符集中,一个字符最多可能占用4个字节,255个字符最多占用255*4= 10220bytes
innodb 默认row-format = Dynamic
dynamic row format
支持了page压缩 format格式下,innodb会把一行的最长的可变长那些列放到单独的off-page中去,并在cluster index上为溢出页保留一个20byte的指针,直到cluster index leaf-node page可以装下它。这通常和page大小以及row占用的总字节长度有关。
当行太长时,将选择最长的列放到页外存储,直到聚集索引记录适合B树页的大小。同时,小于或等于40字节的文本列和BLOB列存储在行中。
disk I/O
Innodb 会使用异步的disk I/O,如果可以的话。方法为:创建一些I/O线程,同时允许在I/O仍在进行时继续执行其他数据库操作。Linux和Windows环境下,会使用可用的OS library方法执行native的异步I/O
How Pages Relate to Table Rows
https://dev.mysql.com/doc/refman/5.7/en/innodb-file-space.html
最大的row length 为略微低于数据页 size的一半,如默认情况page size =16KB ,则单行数据要略小于8KB
如果row没有超过超过最大row length,它的所有列都会存到这个page中。
反之,则会将可变长的列放到额外的off-page中,直到满足row length限制。
额外的off-page依据列存放依赖row format:
COMPACT and REDUNDANT Row Formats 存储前768 bytes在当前row中,其余的放到溢出页中,768个字节中包含了20-byte的value存储列的真实长度及溢出数据存储的位置
DYNAMIC and COMPRESSED Row Formats 存储20-byte的指针在当前row中
Buffer pool
https://dev.mysql.com/doc/refman/5.7/en/innodb-change-buffer.html
Buffer pool一般会配置为mysql实例的80%的内存,来提高查询速度
基于LRU算法,将Pool分为New Sublist和OldSublist,新增的查询会放到New Sublist,同时可能淘汰掉Old空间的数据
change buffer
Innodb有一个Change Buffer,会将二级索引页的的改变缓存起来
清理操作周期性且高效的更新索引页到磁盘
合并Change Buffer的过程中可能会花费几个小时,当有很多受影响的行或者众多的二级索引需要更新时。在这段时间中,disk I/O会增加,可能导致显著的磁盘绑定查询变慢。
Change Buffer merging也可能在事务提交后、关机、重启时发生。
在内存中,change buffer占据了buffer pool的部分空间。
在磁盘中,change buffer 是system tablespace的一部分
读高性能Mysql摘要的更多相关文章
- 读高性能MySql笔记
1.1 MySQL逻辑架构 MySql服务器逻辑架构图 1.连接管理与安全性 每个客户端连接都会在服务器进程中拥有一个线程,这个连接的查询只会在这个单独的线程中执行,该线程只能轮流在某个CPU核心或者 ...
- mysql中的范式与范式——读<<高性能mysql>>笔记一
对于任何给定的数据库通常都有很多表示方法,从完全的范式化到完全的反范式化,以及两者的折中.在范式化的数据库中,每个事实数据会出现并且只出现一次.相反,在反范式化的数据库中,可能会存储在多个地方. 那什 ...
- 高性能Mysql主从架构的复制原理及配置详解
温习<高性能MySQL>的复制篇. 1 复制概述 Mysql内建的复制功能是构建大型,高性能应用程序的基础.将Mysql的数据分布到多个系统上去,这种分布的机制,是通过将Mysql的某一台 ...
- 1121高性能MySQL之运行机制
本文来自于拜读<高性能MySQL(第三版)>时的读书笔记作者:安明哲转载时请注明部分内容来自<高性能MySQL(第三版)> MySQL的逻辑构架 MySQL服务器逻辑架构 最上 ...
- 《高性能MySQL》读书笔记--锁、事务、隔离级别 转
1.锁 为什么需要锁?因为数据库要解决并发控制问题.在同一时刻,可能会有多个客户端对表中同一行记录进行操作,比如有的在读取该行数据,其他的尝试去删除它.为了保证数据的一致性,数据库就要对这种并发操作进 ...
- 《高性能MySQL》
<高性能MySQL>(第3版)讲解MySQL如何工作,为什么如此工作? MySQL系统架构.设计应用技巧.SQL语句优化.服务器性能调优.系统配置管理和安全设置.监控分析,以及复制.扩展和 ...
- 转:高性能Mysql主从架构的复制原理及配置详解
温习<高性能MySQL>的复制篇. 1 复制概述 Mysql内建的复制功能是构建大型,高性能应用程序的基础.将Mysql的数据分布到多个系统上去,这种分布的机制,是通过将Mysql的某一台 ...
- 高性能Mysql主从架构的复制原理及配置详解(转)
温习<高性能MySQL>的复制篇. 1 复制概述 Mysql内建的复制功能是构建大型,高性能应用程序的基础.将Mysql的数据分布到多个系统上去,这种分布的机制,是通过将Mysql的某一台 ...
- 《高性能MySQL(第3版)》【PDF】下载
内容简介 <高性能mysql(第3版)>是mysql 领域的经典之作,拥有广泛的影响力.第3版更新了大量的内容,不但涵盖了最新mysql5.5版本的新特性,也讲述了关于固态盘.高可扩展性设 ...
随机推荐
- 使用deeplabv3+训练自己数据集(迁移学习)
概述 在前边一篇文章,我们讲了如何复现论文代码,使用pascal voc 2012数据集进行训练和验证,具体内容可以参考<deeplab v3+在pascal_voc 2012数据集上进行训练& ...
- 安卓app功能或自动化测试覆盖率统计(不用instrumentation启动app)
一文带你揭秘如何采取非instrumentation启动app,打造实时统计覆盖率,一键触发覆盖率测试报告. 在上篇文章,一文带你解决Android app手工测试或者自动化测试覆盖率统计(撸代码版) ...
- 当安装、卸载件包时,出现依赖问题 error: Failed dependencies解决办法
error: Failed dependencies:-- 依赖关系非常复杂,当你试图先安装任何一个包时都会出现这样的依赖关系错误,这时候你就应该强制安装了,我认为只要你把服务或软件需要的包都装上,强 ...
- 总线SPI的Arduino库函数
来源参考:https://www.cnblogs.com/MyAutomation/p/9348480.html 总线SPI的Arduino库函数 SPI基本知识 SPI:高速同步串行口.是一种标准的 ...
- 51单片机I2C总线
I2C总线是飞利浦公司推出的一种串行总线,所有器件共用两根信号线,实现数据的传输. 总线接口接了上拉电阻,默认为高电平,所以就可以用"当低电平出现"来标记出一种起始信号.我个人把它 ...
- win10下安装使用Docker:Docker for Windows
一.下载win10下安装docker和桌面管理的工具: 下载地址:Docker for Windows 安装软件学习地址:https://www.runoob.com/docker/docker-tu ...
- Talk is cheap. Show me the code的由来
Date: Fri, 25 Aug 2000 11:09:12 -0700 (PDT) From:Linus Torvalds Subject Re: SCO: "thread creati ...
- DX12龙书 00 - 环境配置:通过 Visual Studio 2019 运行示例项目
0x00 安装 Visual Studio 2019 安装 Visual Studio 2019 以及相关组件. 注:安装组件时带的 Windows 10 SDK 可以在 Individual com ...
- 创建自定义视图在Android矩阵效果画布教程
介绍 下面是一个快速教程,教你如何在Android中创建自定义视图.自定义视图创建一个矩阵雨效果. 本教程发布在http://www.androidlearner.com/. 背景 下面是关于如何工作 ...
- ls: 显示目下的内容及相关属性信息
ls: 显示目下的内容及相关属性信息 [功能说明] ls 命令可以理解为英文单词 "list" 的缩写,其功能是列出目录的内容及其内容属性信息(list directory con ...