SQL Server的实例恢复解析
同Oracle一样,SQL Server在非一致性关闭的时候也会进行实例恢复(Instance Recovery),本文根据stack overflow的文章介绍一些SQL Server实例恢复的知识。
原文链接:https://stackoverflow.com/questions/41932735/sql-server-instance-recovery
关于Oracle的实例恢复参考之前的博文:http://www.cnblogs.com/leohahah/p/6973600.html
同时其他可参考的链接有:https://www.sqlskills.com/blogs/paul/how-do-checkpoints-work-and-what-gets-logged/
https://technet.microsoft.com/en-us/library/ms191455(v=sql.105).aspx
首先看一下SQL Server中事务日志的作用:
在SQL Server数据库中,事务日志用于记录事务在Buffer Cache中的做的页更改。
当我们更新一些数据时,数据库会把相关数据页的前镜像和后镜像都记录在事务日志中,并为每个事务生成一个唯一的LSN(log seq number),在检查点发生时SQL Server确保检查点LSN之前的脏块被全部写入到磁盘。因此SQL Server的事务日志兼有redo和undo的作用。
但是,如果我们的数据库被强制关闭或者服务器异常掉电重启,数据库就将处于非一致性的状态(没业务的库除外),这意味检查点之后的所有事务(无论是提交还是未提交的),都出现了异常,提交的事务可能脏块未被写入磁盘,未提交的长事务可能有一部分脏块已经被写入到磁盘,数据库必须处于一致状态才能被正常打开,因此此时必须进行实例恢复。
SQL Server的实例恢复分两个阶段:
1.前滚
此阶段只处理已提交的事务,根据boot page中记录的检查点和事务日志的记载,SQL Server重构检查点之后的内存脏块并按正常机制提交已提交事务的脏块。
对未提交事务的脏块暂时不做操作。
2.回滚
此阶段处理未提交的事务,SQL Server根据事务日志中记载的更改块前镜像,去覆盖硬盘上那些未提交事务涉及的数据块。
总结一下:
1)实例恢复的目的:
- 将所有已提交事务的脏块写入磁盘。
- 回滚未提交的事务。
- 将检查点推进至已被写入磁盘的事务LSN。
2)实例崩溃之前:
- 一些已提交的事务被事务日志记录,但是脏块未被写入到磁盘
- 一些未提交的长事务中的脏块已经被写入到磁盘(但依然遵循严格的日志先写机制,即:被写到磁盘的脏数据对应的log一定已经被提前写入到disk啦)
- 一些未提交的事务,其日志还留在log buffer中未被写入到磁盘中的事务日志文件。
3)实例恢复阶段:
- Log buffer中所有未提交事务的日志在掉电时全部被清空。(已提交事务的日志默认被写入了磁盘事务日志文件)
- 从boot page中识别出上一个检查点,作为实例恢复的起点。
- 在前滚阶段,SQL Server根据事务日志的记录对所有脏块进行重现。(无论是提交还是未提交的事务)然后将已提交事务的脏块写入磁盘,对未提交事务的脏块暂不作操作。
- 在回滚阶段,SQL Server根据事务日志中记载的前镜像对所有未提交的事务进行回滚。
- 更新boot page中的检查点LSN和事务日志中的LSN。
在以上的介绍中我们提到了boot page,那么什么是boot page呢?
每个数据库都会有一个记录数据库重要信息的页,只有一页一般是 PRIMARY filegroup的第9个页。我们可以使用如下命令查看这一页的信息:
DBCC TRACEON (3604);
go
DBCC PAGE ('test',1,9,3)
go
关于DBCC PAGE的用法这里解释一下:
dbcc page ( {'dbname' | dbid}, filenum, pagenum [, printopt={0|1|2|3} ])
The printopt parameter has the following meanings:
0 - print just the page header
1 - page header plus per-row hex dumps and a dump of the page slot array (unless its a page that doesn't have one, like allocation bitmaps)
2 - page header plus whole page hex dump
3 - page header plus detailed per-row interpretation
检查点LSN被记录在boot page中,这是实例恢复的起点,如果这个page无法被访问,那么数据库就不能被附加,打开,或者做其他任何操作。检查点LSN只会被记录在bootpage中,因此这是一个对于实例恢复来说不可或缺的页。
对于SQL Server中检查点的解释:
当检查点发生时,无论这个检查点是如何触发的(手动执行检查点命令,或者数据库执行差异备份,或者数据库自动生成的检查点),数据库都会做以下操作:
- 所有的脏块都被写入磁盘,无论事务是否已提交。
- 在这些脏块被写入磁盘之前,所有关于这些脏块更改的事务日志也要被从log buffer中写入到磁盘,这样可以确保实例恢复的有效性和有序性,这个操作被称作write-ahead logging(日志先写),日志被写入硬盘的操作是严格按时间序列化的,不可能以事务为单位来离散的写入到磁盘,因此某个脏块的写入磁盘操作,可能引发log buffer中一些之前的、与本脏块无关的事务日志也被写入磁盘。但这是有好处的,事务日志总是被越早写入磁盘越好。
- 检查点的LSN会被记录到数据库boot page中的dbi_checkptLSN区域。
这里可以复习一些Oracle的检查点机制,也是CKPT进程触发DBWR写脏块,同时如果要写的脏块的scn大于LGWR的scn,DBWR也会触发LGWR把要写的脏块的相关log buffer写入redo文件中,与SQL Server日志先写的机制相似。
SQL Server的实例恢复解析的更多相关文章
- SQL Server数据库有三种恢复模式:简单恢复模式、完整恢复模式和大容量日志恢复模式
SQL Server数据库有三种恢复模式:简单恢复模式.完整恢复模式和大容量日志恢复模式: 1.Simple 简单恢复模式, Simple模式的旧称叫”Checkpoint with truncate ...
- 【故障公告】阿里云 RDS SQL Server 数据库实例 CPU 100% 引发全站故障
非常抱歉,今天 8:48 开始,我们使用的阿里云 RDS SQL Server 数据库实例突然出现 CPU 100% 问题,引发全站故障,由此给您带来麻烦,请您谅解. 发现故障后立即进行主备切换,和 ...
- SQL Server 多实例下的复制
一.本文所涉及的内容(Contents) 本文所涉及的内容(Contents) 背景(Contexts) 搭建步骤(Procedure) 注意事项(Attention) 二.背景(Contexts) ...
- SQL Server 连接问题案例解析(1)
SQL Server 连接问题案例解析(1) 转载自:http://blogs.msdn.com/b/apgcdsd/archive/2015/04/27/sql.aspx?CommentPosted ...
- 当SQL Server的实例位于集群的特定节点时,数据库无法远程访问
搭建好了一个集群环境,发现当SQL Server的实例位于集群的其中一个节点时,数据库无法远程访问,报如下错误.但在另一个 节点时,数据库访问正常. 标题: 连接到服务器 -------------- ...
- Step7:SQL Server 多实例下的复制
一.本文所涉及的内容(Contents) 本文所涉及的内容(Contents) 背景(Contexts) 搭建步骤(Procedure) 注意事项(Attention) 二.背景(Contexts) ...
- [SQL Server]数据库的恢复
数据库恢复是和数据库备份相对应的操作,它是将数据库备份重新加载到系统中的过程.数据库恢复可以创建备份完成时数据库中存在的相关文件,但是备份以后的所有数据库修改都将丢失. SQL Server进行数据库 ...
- SQL Server数据库实例名与服务器名不一致的解决办法
SQL Server数据库实例名与服务器名不一致的解决办法 --EXEC sp_addlinkedserver -- @server = 'PSHGQ' --GO --select * from ...
- SQL Server 命名实例更改端口进行发布订阅
原文:SQL Server 命名实例更改端口进行发布订阅 两台数据库服务器,都没有加入域,都安装多实例,端口也不一样了.现在使用命名实例进行复制,折腾了好久,才发现解决方法. 服务器A:myserve ...
随机推荐
- solr(六): 集群
前言 随着用户的增多,空间和并发量越来越多,会导致一台solr服务器干不过了.这时候,就需要将solr集群以下. 集群架构 由多台服务器共同完成索引和搜索任务 实现的思路是将索引数据进行shard(分 ...
- RabbitMQ系列(六)你不知道的RabbitMQ集群架构全解
前言 本文将系统的介绍一下RabbitMQ集群架构的特点.异常处理.搭建和使用中要注意的一些细节. 知识点 一.为什么使用集群? 二.集群的特点 三.集群异常处理 四.集群节点类型 五.集群搭建方法 ...
- 痞子衡嵌入式:恩智浦半导体全系无线(BLE, Zigbee, Thread, 2.4G, Sub-1G)微控制器芯片一览
大家好,我是痞子衡,是正经搞技术的痞子.今天痞子衡给大家介绍的是恩智浦半导体全系列无线微控制器芯片. IoT物联网是未来的趋势,半导体厂商作为IoT产业的上游,主要提供核心的无线芯片,作为半导体知名厂 ...
- 记录一下对swiper4.x.js在H5单页中的滑动优化
应用场景 仅仅应用于单页应用的滑动操作,用swiper4.x接管页面的滚动操作.用来支持顶部和尾部的回弹效果,进一步来支持常见那种下拉刷新动画效果.不适用于轮播图那种应用场景. 虽然只是针对swipe ...
- Hyperledger Fabric链码之三
在<Hyperledger Fabric链码之一>和<Hyperledger Fabric链码之二>中我们介绍了链码的定义,并通过dev网络测试了测试了自己编写的链码程序. 本 ...
- Oracle 如何开启归档模式
Oracle开启归档 场景:某所的数据库没有开启归档,如何开启归档模式的文档. 1.查看oracle归档状态 SQL> archive log list; 数据库日志模式 非存档模式 //目前不 ...
- C# XML入门
什么是XML? XML:可扩展标记语言. XML的作用: 纯文本,兼容性强. 和HTML的区别: xml: 主要用来处理.存储数据.无规定标签,可扩展. html:对数据的显示和描述. 语法标签固定. ...
- ABP Changing Httpcode status
小弟初来乍到,分享一些工作学习中遇到的问题和解决方式,如有不准确或是有错误的地方,希望不吝赐教,谢过了. --Dogtwo 起因: ABP 中异常处理的思路是很清晰的.一共五种类型的异常类. Abp ...
- mybatis_04 resultType和resultMap区别
resultType 使用resultType进行结果映射时,查询的列名和映射的pojo属性名完全一致,该列才能映射成功. 如果查询的列名和映射的pojo属性名全部不一致,则不会创建pojo对象: 如 ...
- Python全栈开发之---输入输出与流程控制
Python简介 python是吉多·范罗苏姆发明的一种面向对象的脚本语言,可能有些人不知道面向对象和脚本具体是什么意思,但是对于一个初学者来说,现在并不需要明白.大家都知道,当下全栈工程师的概念很火 ...