原文:利用Ring Buffer在SQL Server 2008中进行连接故障排除

出自:http://blogs.msdn.com/b/apgcdsd/archive/2011/11/21/ring-buffer-sql-server-2008.aspx

SQL Server 2008中包含一个新功能,旨在帮助解决特别棘手的连接问题。这个新功能是Connectivity Ring Buffer,它可以捕捉每一个由服务器发起的连接关闭记录(server-initiated
connection closure),包括每一个session或登录失败事件。为了进行有效的故障排除,Ring Buffer会尝试提供客户端的故障和服务器的关闭动作之间的关系信息。只要服务器在线, 最高1K的Ring
Buffer条记录后,Buffer开始循环覆盖,即从最老的记录开始覆盖。Connectivity
Ring Buffer的记录是能够使用DMV查询的:

SELECT CAST(record AS XML) FROM sys.dm_os_ring_buffers

WHERE ring_buffer_type = 'RING_BUFFER_CONNECTIVITY'

上述指令会选择所有记录为XML类型;在Management Studio中,你可以单击记录,从而获得更具可读性的版本。如果你想使用SQL查询XML记录从而找到相应的问题,你可以使用SQL
server的XML 支持,将之变为一个临时的表,从而查询记录。

一个基本的Buffer entry:Killed SPID

一个导致服务器发起的连接关闭的简单方法是打开两个SQL服务器的连接,找到一个连接的SPID,然后从另一个连接中将该SPID杀死。

C:\>osql -E

1> SELECT @@spid

2> go

------

51

(1 row affected)

C:\>osql -E

1> kill 51

2> go

1>



如果你做了上述工作,然后查询Ring Buffer,你会得到和如下类似的结果:

">

<ConnectivityTraceRecord>

<RecordType>ConnectionClose</RecordType>

<RecordSource>Tds</RecordSource>

</Spid>

<SniConnectionId>B7882F3C-3BA9-45A7-8D23-3C5C05F9BDF9</SniConnectionId>

</SniProvider>

<RemoteHost>&lt;local machine&gt;</RemoteHost>

</RemotePort>

<LocalHost />

</LocalPort>

<RecordTime>5/6/2008 22:47:35.880</RecordTime>

<TdsBuffersInformation>

</TdsInputBufferError>

</TdsOutputBufferError>

</TdsInputBufferBytes>

</TdsBuffersInformation>

<TdsDisconnectFlags>

</PhysicalConnectionIsKilled>

</DisconnectDueToReadError>

</NetworkErrorFoundInInputStream>

</ErrorFoundBeforeLogin>

</SessionIsKilled>

</NormalDisconnect>

</NormalLogout>

</TdsDisconnectFlags>

</ConnectivityTraceRecord>

<Stack>

">0X01CA0B00</frame>

">0X01CA0DB1</frame>

">0X01DF6162</frame>

">0X02E53C98</frame>

">0X02E54845</frame>

">0X02E57BE9</frame>

">0X02E38F57</frame>

">0X02E3B2C0</frame>

">0X02E3C832</frame>

">0X02E3D55E</frame>

">0X781329BB</frame>

">0X78132A47</frame>

</Stack>

</Record>

不同的记录类型包括不同的信息。Connectivity Ring Buffer 记录的三种记录类型分别是:ConnectionClose,Error,和LoginTimers。上面的结果是一个ConnectionClose,因为这不是一个登陆时超时,或者其它的登陆失败的场景:

<RecordType>ConnectionClose</RecordType>

我们可以看出,SPID  55的连接关闭了:



<![endif]>

</Spid>

我们可以看到连接是本地的(<local machine>表明其是一个本地的,shared memory类型的连接)。



<![endif]>

<RemoteHost>&lt;local machine&gt;</RemoteHost>

当使用TCP协议进行连接时,可以获得更多的相关信息-例如,本地IP地址,端口,以及远程IP地址和端口,从而允许你唯一的确定客户机及其应用。另外,Ring
Buffer包括了一个时间戳以及与之相对应的SPID(如果有的话),这样才能形成一个完整的对应关系。(因为随着时间的推移SPID会被不同的连接所重用)。

我们同样可以看到客户发的TDS包中有多少bytes,并且可以知道是否在TDS中有任何的错误:

</TdsInputBufferError>

<</TdsOutputBufferError>

<</TdsInputBufferBytes>

最相关的,最易于分析的信息记录在TdsDisconnectFlags中,有一系列的值,记录了关闭连接的状态。这里,我们看到没有发现错误,但是这里记录了这也不是一个正常的断开或者一个正常的登出。从如下的flag中,这个session是被杀死的:

</SessionIsKilled>

一个更有意思的例子:DC 连接性问题

跟踪被杀死的SPID看起来很cool。但是Connectivity Ring Buffer更重要的最用是帮助我们可以在不使用network
monitor的情况下来解决棘手的问题。以下是一个Connectivity Ring Buffer中Login Time记录的例子,如果没有代价高昂的问题重现过程并且分析网络抓获的包,这个问题很难查明:

">

<ConnectivityTraceRecord>

<RecordType>LoginTimers</RecordType>

</Spid>

<SniConnectionId>B401B045-3C82-4AAC-A459-DB0520925431</SniConnectionId>

</SniConsumerError>

</SniProvider>

</State>

<RemoteHost>&lt;local machine&gt;</RemoteHost>

</RemotePort>

<LocalHost />

</LocalPort>

<RecordTime>5/6/2008 23:17:42.556</RecordTime>

<TdsBuffersInformation>

</TdsInputBufferError>

</TdsOutputBufferError>

</TdsInputBufferBytes>

</TdsBuffersInformation>

<LoginTimers>

</TotalLoginTimeInMilliseconds>

</LoginTaskEnqueuedInMilliseconds>

</NetworkWritesInMilliseconds>

</NetworkReadsInMilliseconds>

</SslProcessingInMilliseconds>

</SspiProcessingInMilliseconds>

</LoginTriggerAndResourceGovernorProcessingInMilliseconds>

</LoginTimers>

</ConnectivityTraceRecord>

<Stack>

">0X01CA0B00</frame>

">0X02E3C832</frame>

</Stack>

</Record>

在这个情况下,在客户端,我们可以看到:

[SQL Server Native Client 10.0]Shared Memory Provider: Timeout error [258].

[SQL Server Native Client 10.0]Login timeout expired

[SQL Server Native Client 10.0]Unable to complete login process due to delay in login response

获得操作系统的错误消息,不能说明任何问题:

C:\>net helpmsg 258

The wait operation timed out.

在服务器的errorlogs里面,什么都没有。然而Ring Buffer中的记录非常有意思。LoginTimers中记录了整体处理时间(overall
processing time):

</TotalLoginTimeInMilliseconds>

秒:



<![endif]>

</SspiProcessingInMilliseconds>

SSPI(Security Support Provider Interface),是一个SQL Server使用Windows
Authentication的接口。当Windows login是一个domain account,SQL Server使用SSPI和Domain
Controller交互,从而验证用户身份。记录中可以看到,SSPI过程占用了大量的时间,这表明和Domain Controller交互时有延时,很有可能是SQL服务器和DC之间的物理连接有问题,或者DC上的一些软件问题。可以看到,我们没有进行网络抓包,也没有重现问题,我们就已经把问题缩小到SQL
Server和Domain Controller之间的交互上面来了。(Connectivity Ring Buffer默认是打开的)

Trace Flags

Connectivity Ring Buffer 默认是打开的,它默认跟踪所有的由服务器发起的连接关闭。如果你在客户端看到一个错误,但是在Ring Buffer中没有记录,这就表明服务器看到的是一种“重置”类型的连接关闭,这种连接关闭类似于客户端正常关闭连接的行为,或者是由于服务器外部因素所造成的连接关闭;(例如,一个网络硬件的故障)。如果是这种情况,你就需要关注潜在的网络互联问题。如果你在Ring
Buffer中看到了一个条目它可以指出为什么服务器要关闭这个链接,那么这个条目就很可能可以极大的帮助我们进行故障排查。例如,如果你看到一个连接关闭是由于TDS包中的信息不合法,那么你就可以去检查那些可能会损坏网络包的设备,包括网卡,路由和集线器等。下面你会看到,通过使用一个trace
flag,你可以让Connectivity Ring Buffer记录所有连接关闭事件。这样你就能观察到客户端发起的连接关闭的情形和潜在的错误。

有两个trace flag,可以用于改变Connectivity Ring Buffer 的行为。

完全关闭Connectivity Ring Buffer,可以开启trace flag 7826:

)

默认情况下客户端发起的连接关闭是不被记录的(因为这是正常的情况,而不是一个错误);当一个客户结束的它的session,它就断开。一般来说,我们建议不要去跟踪客户端发起的连接关闭,因为真正有用的Buffer记录会被覆盖(当你有很多正常表现的连接时,这种情况发生可能性会很大),或者会被隐藏在一个堆正常情况的记录中。这会使你错过真正的错误问题。如果你真的想要观察客户端的连接关闭,你可以使用trace
flag 7827来开启这个功能:

)

<Frame>tags是什么?

通过sys.dm_os_ring_buffers DMV 可以访问一系列内部信息,它包含了但不仅限于Connectivity Ring Buffer。作为DMV基础的一部分,大多数的Ring
Buffers 提供了事件发生时的栈踪迹(stack trace),每一个<frame>提供了一个十六进制的函数地址。这些都可以分解为函数名,并dump
Sqlservr.exe进程,在WinDbg打开dump,并采用基于函数的地址的LM命令。

利用Ring Buffer在SQL Server 2008中进行连接故障排除的更多相关文章

  1. SQL Server 2008中的数据压缩

    SQL Server 2008中引入了数据压缩的功能,允许在表.索引和分区中执行数据压缩.这样不仅可以大大节省磁盘的占用空间,还允许将更多数据页装入内存中,从而降低磁 盘IO,提升查询的性能.当然,凡 ...

  2. SQL Server 2008中数据压缩

    SQL Server 2008中引入了数据压缩的功能,允许在表.索引和分区中执行数据压缩.这样不仅可以大大节省磁盘的占用空间,还允许将更多数据页装入内存中,从而降低磁盘IO,提升查询的性能.当然,凡事 ...

  3. SQL Server 2008中新增的 1.变更数据捕获(CDC) 和 2.更改跟踪

    概述 1.变更数据捕获(CDC)        每一次的数据操作都会记录下来 2.更改跟踪       只会记录最新一条记录   以上两种的区别:         http://blog.csdn.n ...

  4. SQL Server 2008中新增的变更数据捕获(CDC)和更改跟踪

    来源:http://www.cnblogs.com/downmoon/archive/2012/04/10/2439462.html  本文主要介绍SQL Server中记录数据变更的四个方法:触发器 ...

  5. SQL Server 2008中增强的"汇总"技巧

    本文转载:http://www.cnblogs.com/downmoon/archive/2012/04/06/2433988.html SQL Server 2008中的Pivot和UnPivot: ...

  6. SQL点滴15—在SQL Server 2008中调用C#程序

    原文:SQL点滴15-在SQL Server 2008中调用C#程序 T-SQL的在执行普通的查询的时候是很高效的,但是在执行循环,判断这样的语句的时候效率就不那么的高了.这时可以借助CLR了,我们可 ...

  7. 在SQL Server 2008中调用.net,dll

    原文:在SQL Server 2008中调用.net,dll T-SQL的在执行普通的查询的时候是很高效的,但是在执行循环,判断这样的语句的时候效率就不那么的高了.这时可以借助CLR了,我们可以在SQ ...

  8. SQL Server 2008中的CDC(Change Data Capture)功能使用及释疑

    SQL Server 2008中的CDC(Change Data Capture)功能使用及释疑 关键词:CDC   原文:http://www.cnblogs.com/chenxizhang/arc ...

  9. SQL Server 2008中的MERGE(不仅仅是合并)

    SQL Server 2008中的MERGE语句能做很多事情,它的功能是根据源表对目标表执行插入.更新或删除操作.最典型的应用就是进行两个表的同步. 下面通过一个简单示例来演示MERGE语句的使用方法 ...

随机推荐

  1. 基于 Groovy 的自动化构建工具 Gradle 入门(转)

    本人工作之初没有使用自动化构建,后来敏捷了,开始使用 Ant - 完全面向过程的定义步骤,不进行依赖管理.再发展到 Maven,面向对象的方式管理工程,有了依赖的管理,JAR 包统一从中央仓库获得,保 ...

  2. Java equals 和 hashcode 方法

    问题 面试时经常会问起字符串比较相关的问题, 总结一下,大体是如下几个: 1.字符串比较时用的什么方法,内部实现如何? 2.hashcode的作用,以及重写equal方法,为什么要重写hashcode ...

  3. ecshop中getAll ,getOne ,getRow的区别

    ecshop的数据库抽象层其实就是在模仿adodb $GLOBALS['db']->getAll($sql);//以二维关联数组返回所有数据 $GLOBALS['db']->getOne( ...

  4. 怎样在万网加入Lync Online SRV记录

    万网已经支持SRV记录解析了,可是有好几个朋友问我怎么加入SRV记录(假设域名提供商不支持,能够通过DNSPOD来实现),过程例如以下 1:绑定域名至Office 365 略,请查看我的视频或者博客中 ...

  5. EJB体系结构

    为了适应企业的快速发展.缩短企业信息系统的设计和开发周期.降低构建信息系统的成本,Sun公司制订了Java2 SDK Enterprise Edition(J2EE)规范,定义基于组件的方式设计.开发 ...

  6. net MVC 的八个扩展点

    net MVC 的八个扩展点 MVC模型以低耦合.可重用.可维护性高等众多优点已逐渐代替了WebForm模型.能够灵活使用MVC提供的扩展点可以达到事半功倍的效果,另一方面Asp.net MVC优秀的 ...

  7. mysql如何更新一个表中的某个字段值等于另一个表的某个字段值

    表A和表B,现在希望更新A表,当 A.bid = B.id时,a.x = b.x, a.y=b.y,请问mysql中sql语句 update a inner join b on a.bid=b.id ...

  8. OpenCV, color reduction method

    转载请注明出处!!!http://blog.csdn.net/zhonghuan1992 OpenCV, colorreduction method 目标: 这次学习的目标是回答以下的几个问题: 1 ...

  9. Qt学习一门:直接使用QT具

    今天,通过直接使用QT一些工具来编写命令行程序.你可以看到一种Qt更一般的用法. 内容很easy,输出电流日期. 首先,用一个QDate分类,可以使用QDate类的静态方法currentDate为了得 ...

  10. 软件測试系统文章(文件夹&amp;链接在此)

    前言 我会在此账号上写一系列关于软件測试的文章,故在此置顶软件測试系列文章的文件夹和链接,以方便大家阅读! 文件夹 软件測试系列之入门篇(一) 软件測试系列之了解篇(二) 软件測试系列之黑白盒(三) ...