SQL Server 的事务日志包含所有数据修改的操作记录。分析日志一般作为解决某些问题的最后手段,如查看某些意外的修改。理解和分析日志内容是件非常困难的事情,fn_dblog通常会输出非常多的数据,查看也比较困难。我尝试用一些实例帮助大家更好地分析和理解日志。

SQL Server 使用Write-ahead logging (WAL)方式保证任何数据变更的日志要比数据变更先发生。同时,对数据库中任何数据变更操作都会被记录在日志中。注意所有的数据对象(tables, views, stored procedures, users, permissions etc)是元数据,但是也数据。所以对数据库中任何对象的变更操作都会被记录在日志中。注意,像最小化日志操作、大容量日志操作和Truncate(谣传的“无日志操作”)都是事务性的,都会记录在日志中。

事务日志中的每一条日志记录由LSN(Log Sequence Number)唯一标识。LSN是有序的,如果LSN2大于LSN1,则LSN2的日志所代表的数据修改操作发生在LSN1之后。

下面用一个例子来开始分析。将使用未公开的函数sys.fn_dblog,它能够读取当前数据库活动部分的事务日志。此函数返回的 [Transaction ID] 字段表示SQL Server 为每个事务分配的事务ID,同一个事务所有的日志记录具有一样的事务ID。

use master
go
create database LogTest
go
use LogTest
go
create table demotable (
id int not null identity(1,1) primary key,
data char(20),
created_at datetime default getutcdate());
go insert into demotable (data) values ('standalone xact');
go 5 begin transaction
go insert into demotable (data) values ('one xact');
go 5 commit;
go delete from demotable
where id in (2,5,6,9);
go

sys.fn_dblog返回的[operation]表示进行的是什么操作,我们先看看一个非常重要的操作: LOP_BEGIN_XACT。它标记一个事务的开始,也是日志中唯一包含事务开始时间的记录,同时还包含发出语句用户的SID。

select [Current LSN], [Operation], [Transaction ID], [Parent Transaction ID],
[Begin Time], [Transaction Name], [Transaction SID]
from fn_dblog(null, null)
where [Operation] = 'LOP_BEGIN_XACT'

SQL Server总是对数据操作使用事务,不管是用户定义的显示事务或者是自动的隐式事务。 LSN:00000023:00000033:0001开始事务0000:00000352,事务名叫做CREATE TABLE。LSN开始了INSERT事务0000:00000356,这就是脚本中的5个单独的INSERT语句,每个INSERT是一个隐式事务。它还还包括事务0000:00000359,0000:0000035a,0000:0000035b,0000:0000035c。观察事务ID,会发现者是按1增长的16进制数。再看LSN 00000023:00000061:0001的事务0000:0000035d,它叫做user_transaction。这是脚本中用户定义的INSERT的显式事务。它从BEGIN TRANSACTION开始,包括了5个INSERT,而不像之前产生5个INSERT隐式事务。最后LSN 00000023:00000070:0001开始了DELETE事务0000:00000360。

还发现有两个SplitPage的Parent Transaction ID等于CREATE TABLE的事务ID。页拆分是B-TREE根据排序键维护数据顺序的一种方式。注意,这里的两页拆分是因为CREATE TABLE插入元数据导致内部元数据表的页拆分,而不是用户表。

在第一个INSERT事务后接着一个事务Allocate Root。正常情况,创建表时,不会分配页给它。第一个INSERT会触发分配第一个页配给表。分配操作由单独的事务完成,并且会立即提交。即使触发页分配的那个INSERT事务被回滚或者延迟提交,也不会影响其它的数据插入操作。从这里也可以看出,一个会话中,可以开始和提交独立于会话主事务之外的事务的,只是这个功能没有提供给T-SQL,只是内部使用。

Transaction SID 列表示启动事务的登录名的SID,可以用SUSER_SNAME()函数获取到实际的登录名。

观察一个事务的详细日志内容

select [Current LSN], [Operation],
[AllocUnitName], [Page ID], [Slot ID],
[Lock Information],
[Num Elements], [RowLog Contents 0], [RowLog Contents 1],
[RowLog Contents 2]
from fn_dblog(null, null)
where [Transaction ID]='0000:00000356'

我们来看看第一个INSERT事务:356的详细日志内容。很明显,356事务有4条日志。每个事务必须以LOP_BEGIN_XACT开始,以一条日志结,通常是LOP_COMMIT_XACT。还有一条关于锁的日志(LOP_LOCK_XACT)和一条关于实际数据修改的日志(LOP_INSERT_ROWS)。

数据修改操作(如LOP_INSERT_ROWS)总是会记录它操作的物理内容(PageID,SlotID)和对象:分配单元(Allocation Unit ID)和分区ID(Partition ID)。查看AllocUnitName列是确定哪一个对象被修改的最简单的方式。Page ID 和Slot ID告诉我们哪个页的哪一个槽位被事务修改了。16进制90=144十进制,0=0。我们通过DBCC PAGE来看看144页的Slot 0。

dbcc traceon(3604,-1);
dbcc page(7,1,144,3);
------------------------------------------------------------------------
Slot 0 Offset 0x60 Length 39 Record Type = PRIMARY_RECORD Record Attributes = NULL_BITMAP Record Size = 39 Memory Dump @0x00000000117AA060 0000000000000000: 10002400 01000000 7374616e 64616c6f 6e652078 ..$.....standalone x
0000000000000014: 61637420 20202020 797d6f00 64a60000 030000 act y}o.d...... Slot 0 Column 1 Offset 0x4 Length 4 Length (physical) 4 id = 1 Slot 0 Column 2 Offset 0x8 Length 20 Length (physical) 20 data = standalone xact Slot 0 Column 3 Offset 0x1c Length 8 Length (physical) 8 created_at = 2016-08-16 06:45:55.390 Slot 0 Offset 0x0 Length 0 Length (physical) 0 KeyHashValue = (8194443284a0)
Slot 1 Offset 0xae Length 39

从输出的页,我们确定144页的Slot 0 的确存储着第一个INSERT的内容,也佐证了sys.fn_dblog内容是正确的。日志中的这部分内容可以帮助我们解决一个问题:现在知道某个行的位置(页ID和槽ID),想要找出是哪一个事务修改了这一行?可以通过搜索日志记录中的Slot ID和Page ID找到相关事务。但是,这个方法对于B-TREE来说是非常困难的。因为B-TREE发生页拆分时会改变行的物理地址,在匹配时就会很困难了。

Lock Information列的完整内容:

HoBt 72057594039042048:ACQUIRE_LOCK_IX OBJECT: 7:245575913:0 ;
ACQUIRE_LOCK_IX PAGE: 7:1:144 ;
ACQUIRE_LOCK_X KEY: 7:72057594039042048 (8194443284a0)

其中有表的Object ID,页ID和索引键的键锁信息。对于B-TREE,键锁就是键值的HASH值,所以通过它能定位到数据行(就算发生页拆分,但是键值是不会变的)。

select %%lockres%%, *
from demotable
where %%lockres%% = '(8194443284a0)'; id data created_at
--------------- --------- -------------------- -----------------------
(8194443284a0) 1 standalone xact 2016-08-16 06:45:55.390

通过键锁信息,我们正确定位到第一个INSERT的行。注意,HASH值存在HASH碰撞的可能,即不同的键值生成了同样的HASH值。碰撞的概率是非常低的,如果发生, 上面的查询会返回多行。

总结

  1. 原文地址:How to read and interpret the SQL Server log ,非逐字翻译,在自己理解的基础上的意译,有增和删内容。
  2. 解析日志内容,通常只会在少数特殊的场景用到,但会对SQL Server的理解有帮助。

如何解读SQL Server日志(1/3)的更多相关文章

  1. 如何解读SQL Server日志(3/3)

    如何查看被截断的日志 如果数据库做了日志备份操作,则日志会被截断,然后原来活动的VLF会被重用.使用sys.fn_dblog将会看不到任何被截断的日志.那如何查看日志备份中的日志呢?使用fn_dump ...

  2. 如何解读SQL Server日志(2/3)

    接下来说说返回的RowLogo Content列,例子中返回了三个列.这些列包含了数据操作的"有效工作负载(Playload)"记录.根据不同操作类型有效负载的内容也是不同的,但是 ...

  3. 清理SQL Server日志释放文件空间的终极方法

    清理SQL Server日志释放文件空间的终极方法  转自:http://www.cnblogs.com/dudu/archive/2013/04/10/3011416.html [问题场景]有一个数 ...

  4. SQL Server日志文件庞大收缩方法(实测好用)

    原文:SQL Server日志文件庞大收缩方法(实测好用) 这两个命令连续执行,间隔时间越少越明显(可多次运行),直到达到效果 --截断 BACKUP LOG CloudMonitor TO DISK ...

  5. 收缩SQL Server日志不是那么简单

    收缩SQL Server日志不是那么简单的(翻译)   原文地址:http://rusanu.com/2012/07/27/how-to-shrink-the-sql-server-log/ 说明:本 ...

  6. SQL Server 日志和代理的错误日志

    本文介绍的日志不是事务日志,而是SQL Server 日志和代理的错误日志,按照主体把错误日志分为SQL Server.SQL Server Agent.Database Mail,以及 Window ...

  7. sql server 日志文件结构及误操作数据找回

    一. 概述 在sql server 里有数据文件.mdf和日志文件.ldf,日志文件是sqlserver数据库的另一个重要组成部分,日志文件记录了所有事务以及每个事务对数据库所做的修改.为了提高数据库 ...

  8. SQL Server日志文件过大 大日志文件清理方法 不分离数据库

    SQL Server日志文件过大    大日志文件清理方法 ,网上提供了很多分离数据库——〉删除日志文件-〉附加数据库 的方法,此方法风险太大,过程也比较久,有时候也会出现分离不成功的现象.下面的方式 ...

  9. 解决Sql Server 日志满了,设置收缩

    解决Sql Server 日志满了,设置收缩: --查看文件占用空间 . '文件大小(MB)',* from sysfiles; ALTER DATABASE SpyData SET RECOVERY ...

随机推荐

  1. hadoop使用问题

    前提 环境 ubuntu 安装hadoop 已经有一段时间 1.启动的时候提示 Connection reset by peer 这个查看日志,里面有说 ssh里面某个文件的权限太大 这个ssh里修改 ...

  2. google map javascript api v3 例子

    之前一直用百度map,但如果是国外的项目就需要用google地图.由于在国内屏蔽了google地图的服务,因此调用的是一个国内地址(开发用).这个地址没有用key,语言设置也还是中文的. //---- ...

  3. 【C语言学习】《C Primer Plus》第10章 数组和指针

    学习总结 1.数组初始化方式: int a[]={1,2,3} int a[SIZE]={1,2,3} //SIZE是宏定义,数组初始化个数不能大于SIZE,否则报错:当个数小 //SIZE,自动补0 ...

  4. Spring AOP简述

    使用面想对象(Object-Oriented Programming,OOP)包含一些弊端,当需要为多个不具有继承关系的对象引入公共行为时,例如日志,安全检测等.我们只有在每个对象中引入公共行为,这样 ...

  5. TCP Server—Linux

    #include <stdio.h> #include <netinet/ip.h> #define BUFF_SIZE 1024 int main(int argc,char ...

  6. Windows内存小结

    以前写过一篇理解程序内存, 当时主要是针对用户态,下面再稍微深入一点: 我们以32位程序为例(不启用AWE), 总共4G虚拟空间,其中低2G属于用户态, 高2G属于操作系统内核, 每个程序都有自己的低 ...

  7. 《30天自制操作系统》笔记(02)——导入C语言

    <30天自制操作系统>笔记(02)——导入C语言 进度回顾 在上一篇,记录了计算机开机时加载IPL程序(initial program loader,一个nas汇编程序)的情况,包括IPL ...

  8. 说说设计模式~ 模版模式(Template)

    返回目录 模版模式,又被称为模版方法模式,它可以将工作流程进行封装,并且对外提供了个性化的控制,但主流程外界不能修改,也就是说,模版方法模式中,将工作的主体架构规定好,具体类可以根据自己的需要,各自去 ...

  9. iOS开发——高级技术OC篇&运行时(Runtime)机制

    运行时(Runtime)机制 本文将会以笔者个人的小小研究为例总结一下关于iOS开发中运行时的使用和常用方法的介绍,关于跟多运行时相关技术请查看笔者之前写的运行时高级用法及相关语法或者查看响应官方文档 ...

  10. SlickUpload Upload to disk

    The file upload stream provider is a built-in SlickUpload provider that uses the filesystem for uplo ...