《Troubleshooting SQL Server》读书笔记-CPU使用率过高（上）

第三章 High CPU Utilization.

CPU使用率过高问题很容易被发现，但是诊断却不是很容易。CPU使用过高很多时候会成为其它问题的替罪羊，所以在确认和故障诊断时要抽丝剥茧。

调查CPU压力

三个主要的工具：性能监视器，SQLTrace,DMV.

性能监视器：首先用它来确认是SQL Server还是其它进程使用了过多的CPU。主要计数器有：

Processor/ %Privileged Time :在特权模式下进程线程执行代码所花时间的百分比。基本可以认为是Windows核心使用的CPU
Processor/ %User Time :处理器处于用户模式的时间百分比。应用程序的使用的CPU。
Process (sqlservr.exe)/ %Processor Time :SQLServer.exe线程使用处理器执行指令所花的时间百分比。

还有一些与SQL Server相关CPU消耗的计数器：

SQLServer:SQL Statistics/Auto-Param Attempts/sec
                     SQLServer:SQL Statistics/Failed Auto-params/sec
                     SQLServer:SQL Statistics/Batch Requests/sec
                     SQLServer:SQL Statistics/SQL Compilations/sec
                     SQLServer:SQL Statistics/SQL Re-Compilations/sec
                     SQLServer:Plan Cache/Cache hit Ratio

SQLTrace: 通过Profiler生成SQLTrace脚本，进行服务器端跟踪，来获得高CPU使用时详细信息。

DMV：a. 使用sys.dm_os_wait_stats来得到signal wait,确认CPU压力的程度.

b. 使用sys.dm_os_wait_stats和sys.dm_os_schedulers观察等待类型

c. 使用sys.dm_exec_query_stats和sys.dm_exec_sql_text找出高CPU使用的执行计划和对应的查询

d. 使用sys.dm_os_waiting_tasks观察当前与CPU使用相关等待类型

e. 使用sys.dm_exec_requests正在执行的查询的资源使用状况

调查CPU相关的等待统计：请求执行前，包含请求的会话必需等待，SQL Server会记录等待原因和时间。通过sys.dm_os_wait_stats查询这些信息。

信号等待时间(Signal wait time)：sys.dm_os_wait_stats的wait_time_ms表示等待类型的总共等待时间，signal_wait_time_ms表示线程收到段义和到重新执行间的等待时间，

这些时间主要花在runnable队列里，是纯CPU等待。

通过以下查询得到信号等待的时间比率：

SELECT  SUM (signal_wait_time_ms) AS TotalSignalWaitTime , 
         ( SUM (CAST(signal_wait_time_ms  AS NUMERIC(20, 2)))  
           / SUM (CAST(wait_time_ms AS NUMERIC(20, 2)))  * 100  ) 
                         AS PercentageSignalWaitsOfTotalTime 
FROM    sys .dm_os_wait_stats

也可以查询各类资源等待的比率，下面是等待top 10:

SELECT TOP ( 10 ) 
        wait_type , 
        waiting_tasks_count , 
         ( wait_time_ms - signal_wait_time_ms ) AS resource_wait_time  , 
        max_wait_time_ms , 
         CASE waiting_tasks_count  
           WHEN 0  THEN 0 
           ELSE wait_time_ms / waiting_tasks_count  
         END  AS avg_wait_time 
FROM    sys .dm_os_wait_stats 
WHERE    wait_type NOT  LIKE '%SLEEP%'    -- remove eg. SLEEP_TASK and 
                                        -- LAZYWRITER_SLEEP waits 
         AND  wait_type NOT  LIKE 'XE%'  
         AND  wait_type NOT  IN -- remove system waits    
( 'KSOURCE_WAKEUP', 'BROKER_TASK_STOP', 'FT_IFTS_SCHEDULER_IDLE_WAIT' , 
  'SQLTRACE_BUFFER_FLUSH', 'CLR_AUTO_EVENT', 'BROKER_EVENTHANDLER', 
  'BAD_PAGE_PROCESS', 'BROKER_TRANSMITTER' , 'CHECKPOINT_QUEUE', 
  'DBMIRROR_EVENTS_QUEUE', 'SQLTRACE_BUFFER_FLUSH', 'CLR_MANUAL_EVENT', 
  'ONDEMAND_TASK_QUEUE', 'REQUEST_FOR_DEADLOCK_SEARCH' , 'LOGMGR_QUEUE', 
  'BROKER_RECEIVE_WAITFOR' , 'PREEMPTIVE_OS_GETPROCADDRESS', 
  'PREEMPTIVE_OS_AUTHENTICATIONOPS', 'BROKER_TO_FLUSH'  ) 
ORDER  BY wait_time_ms DESC

与CPU相关的等待类型主要有SOS_SCHEDULER_YIELD,CXPACKET和CMEMTHREAD

SOS_SCHEDULER_YIELD: SQL Server计划程序是协同的多任务计划程序。查询占用一小段时间的CPU后自发地让出CPU给后面的查询，

并且回到可运行队列等待重新被运行，这种等待就是SOS_SCHEDULER_YIELD。

如果此等待时间在sys.dm_exec_requests或者sys.dm_os_waiting_tasks过多，则表示有高CPU使用的查询需要优化或者需要增加CPU。

CXPACKET：多处理器运行并行查询时，当同步多个线程间的查询处理器交换迭代器时出现。

CMEMTHREAD：等待同步内存对象。有些内存对象是不请允许并发访问的，当多个线程试图访问此内存对象时，就会等待。

调查计划程序队列(scheduler queues)：scheduler_id<255的是隐藏的系统计划程序，如DAC，备份等。

SELECT  scheduler_id  , 
        current_tasks_count, 
        runnable_tasks_count
FROM    sys.dm_os_schedulers
WHERE    scheduler_id < 255

current_task_count表示每个计划程序上的任务数，runnable_task_count表示runnable队列中等待CPU的任务。

找出高CPU消耗的查询

主要使用sys.dm_exec_query_stats和sys.dm_exec_sql_text。下面是占用CPU时间的TOP 10查询：

SELECT TOP ( 10 ) 
         SUBSTRING(ST.text, ( QS .statement_start_offset / 2  ) + 1, 
                  ( ( CASE statement_end_offset 
                         WHEN -1 THEN DATALENGTH (st.text) 
                         ELSE QS .statement_end_offset  
                       END  - QS .statement_start_offset ) / 2  ) + 1) 
                  AS statement_text , 
        execution_count  , 
        total_worker_time / 1000 AS total_worker_time_ms  , 
         ( total_worker_time / 1000 ) / execution_count 
                  AS avg_worker_time_ms  , 
        total_logical_reads , 
        total_logical_reads / execution_count  AS avg_logical_reads , 
        total_elapsed_time  / 1000 AS total_elapsed_time_ms , 
         ( total_elapsed_time  / 1000 ) / execution_count 
                  AS avg_elapsed_time_ms , 
        qp .query_plan  
FROM    sys .dm_exec_query_stats qs  
         CROSS  APPLY  sys .dm_exec_sql_text(qs.sql_handle ) st  
         CROSS  APPLY  sys .dm_exec_query_plan(qs.plan_handle) qp  
ORDER  BY total_worker_time DESC

值得注意的是有些情况下缓存计划是会被清除的，如内存压力，数据库状态改变等。使用了with recompile的SP和option (recompile)提示的语句不会缓存执行计划。

当查询因为某些原因被重编译(统计信息改变，架构改变等)，如果经常发生，则会让执行时间统计变得不准确。所以最好是每隔一段时间抓取缓存计划信息，然后汇总对比。

《Troubleshooting SQL Server》读书笔记-CPU使用率过高（上）的更多相关文章

《Troubleshooting SQL Server》读书笔记-CPU使用率过高（下）
<Troubleshooting SQL Server>读书笔记-CPU使用率过高(下) 第三章 High CPU Utilization. CPU使用率过高的常见原因查询优化器会尽量从 ...
SQL SERVER读书笔记：内存
系统先操作地址空间,真正要用的时候才申请物理内存,进行使用. Reserved Memory 保留内存,虚拟内存 Commited Memory 提交内存,物理内存 [如何判断SQL SERVER ...
SQL SERVER读书笔记：阻塞与死锁
阻塞是事务隔离带来的副作用,而并不是SQL SERVER的错. 死锁则是互相争用资源而引发.由于死锁会选择牺牲者,所以死锁的危害没有阻塞大.但有时为了解决死锁,会采取对资源加锁,导致阻塞的方式来避免.
SQL SERVER读书笔记：TempDB
每次SQL SERVER启动的时候,会重新创建. 用于 0.临时表 1.排序 2.连接(merge join,hash join) 3.行版本控制临时表与表变量的区别: 1)表变量是存储在内存中的, ...
SQL SERVER读书笔记：执行计划
执行计划对性能影响甚大. 系统是怎么得出一个号的执行计划的?主要是依赖于准确的统计信息.统计信息准确的前提下,执行语句重用性高,可避免频繁编译,这也有助于提高性能. 但如果怀疑统计信息不够准确,可以强 ...
SQL SERVER读书笔记：JOIN
nested loop join:适用于小数据集,有索引的情况.不占用内存,不用tempdb. merge join:大数据,要排序,多对多,用tempdb: hash join:对大数据集,少用户使 ...
SQL SERVER读书笔记：nolock
让查询语句不去申请共享锁,从而消除死锁,效果立竿见影. 缺点: 1.脏读 2.只能解决共享锁(S锁)参与的问题 3.需要修改语句本身才能使用
SQL SERVER 读书笔记：非聚集索引
对于有聚集索引的表,数据存储在聚集索引的叶子节点,而非聚集索引则存储索引键值和聚集索引键值.对于非聚集索引,如果查找的字段没有包含在索引键值,则还要根据聚集索引键值来查找详细数据,此谓 Book ...
《Troubleshooting SQL Server》读书笔记-内存管理
自调整的数据库引擎(Self-tuning Database Engine) 长期以来,微软都致力于自调整(Self-Tuning)的SQL Server数据库引擎,用以降低产品的总拥有成本.从SQL ...

随机推荐

laravel5.6 调用第三方类库
大概流程: 1. 新建一个目录方类库 2. 配置composer配置文件 3. 在项目中使用终端运行composer dumpautoload 4. 使用时方法调用可以new对象后->方法名 ...
vue h render function & render select with options bug
vue h render function & render select with options bug https://github.com/xgqfrms/vue/issues/41 ...
JMeter脚本增强之参数化
JMeter测试脚本录制或者编写,在Web应用和App上的操作方式可能有一点点区别(其实也差不多,哈哈),但是当脚本录制好了之后,对测试脚本的强化,包括参数化.关联.文本检查.集合点设置,甚至再往后的 ...
mvc4中使用部分视图局部刷新实例
如上效果图,网页中有主视图(上)和部分视图(下),点击提交会把文本框中的值发送到服务器,再返回所有添加的信息,在下方局部更新(只更新部分视图),实现如下: 1.网页主视图代码: @model MvcA ...
scoket常用函数简单介绍
scoket: 是一种抽象层,应用程序通过它来发送和接收数据,使用socket可以将应用程序添加到网络中,与处于同一网络中的其他应用程序进行通信. 简单来说,scoket提供了程序内部与外界通道的 ...
【JavaScript】时间戳转日期格式
时间戳: 1480570979000 $.ajax({ url : "getOrderMsg?shiplabel="+ shiplabel, type : "get&qu ...
hive 导入数据
1.load data load data local inpath "/home/hadoop/userinfo.txt" into table userinfo; " ...
【BZOJ4137】火星商店问题（线段树分治，可持久化Trie）
[BZOJ4137]火星商店问题(线段树分治,可持久化Trie) 题面洛谷 BZOJ权限题题解显然可以树套树,外层线段树,内层可持久化Trie来做. 所以我们需要更加优美的做法.--线段树分治. ...
【BZOJ2216】Lightning Conductor（动态规划）
[BZOJ2216]Lightning Conductor(动态规划) 题面 BZOJ,然而是权限题洛谷题解 $\sqrt {|i-j|}$似乎没什么意义,只需要从前往后做一次再从后往前做一次 ...
MSSQL DBA权限获取WEBSHELL的过程
前言本文主要通过一个案例来演示一下当MSSQL是DBA权限,且不知道路径的时候如何去获取WEBSHELL.当然这种方式对站库分离的无效.我测试的环境是在Win7 64位下,数据库是SQLServer ...

《Troubleshooting SQL Server》读书笔记-CPU使用率过高（上）

《Troubleshooting SQL Server》读书笔记-CPU使用率过高（上）的更多相关文章

随机推荐

热门专题