Sql Server 聚集索引扫描 Scan Direction的两种方式------FORWARD 和 BACKWARD

最近发现一个分页查询存储过程中的的一个SQL语句，当聚集索引列的排序方式不同的时候，效率差别达到数十倍，让我感到非常吃惊
由此引发出来分页查询的情况下对大表做Clustered Scan的时候，
不同情况下会选择FORWARD 或者 BACKWARD差别，以及建立聚集索引时，选择索引列的排序方式的一些思考
废话不多，上代码
先建立一张测试表，在Col1上建立聚集索引，写入100W条数据

create table ClusteredIndexScanDirection

(

    Col1 int identity(1,1),

    Col2 varchar(50),

    Col3 varchar(50),

    Col4 Datetime

)

create unique clustered index idx_Col1 on ClusteredIndexScanDirection(Col1 ASC) 

DECLARE @date datetime,@i int=0

    set @date=GETDATE()

    while @i<1000000

    begin

    insert into ClusteredIndexScanDirection values (NEWID(),NEWID(),DATEADD(MI,@i,GETDATE()-200))

    set @i=@i+1

end

先直观地看一下聚集索引扫描时候的FORWARD 和 BACKWARD

　BACKWARD

　　执行如下分页查询，当按照Col4符合2017-7-18和2017-7-23，并且Col1 倒序排序的时候
　　从执行计划看，Clustered Index Scan的Scan Direction的方式是BACKWARD

FORWARD

　　执行如下分页查询，当按照Col4符合2017-7-18和2017-7-23，并且Col1 正序排序的时候
　　从执行计划看，Clustered Index Scan的Scan Direction的方式是FORWARD

　　查询条件一样，分页情况下，排序方式不一样，性能上有么有差别？肯定有，太明显了，如果没有，本文也就没有什么意义了
　　如图是上述两种查询方式在我本机的测试结果，同样是前100条数据，因为排序方式不同，其代价也是不同的
　　逻辑读，一个是2327，一个是9978次，差别不小吧，在实际场景中，这个差别是非常非常大的，大到足以超乎你想想

对FORWARD和BACKWARD有一个直观的感受之后，来说说这两者的区别

　　如果了解B树索引结构的话，应该知道聚集索引是以类似于B树结构的方式来组织的，既然是B树结构，
　　那么下面这个图就不难理解了，
　　在索引列按照某事方式排序的情况下，比如

　　create unique clustered index idx_Col1 on ClusteredIndexScanDirection(Col1 ASC) 
　　或者是
　　create unique clustered index idx_Col1 on ClusteredIndexScanDirection(Col1 DESC)

　　下面这张图分别是FORWARD和BACKWARD两种Scan direction的实现方式

　　　　　　　　　　　　　　　　FORWARD

　　　　　　　　　　　　　　　　　　　　BACKWARD

　　　　Sql Server究竟选中哪种方式，是FORWARD还是BACKWARD，是依赖于你的索引情况和查询结果集排序情况的
　　　　以我上面的查询为例
　　　　如果是按照查询结果正序排序的方式查询

SELECT *

FROM ClusteredIndexScanDirection WITH (NOLOCK)

WHERE Col4 >=  '2017-7-18'

	AND Col4  <= '2017-7-23'

ORDER BY 1 ASC

OFFSET 0 ROWS FETCH NEXT 100 ROWS ONLY

　　　　也就是要求查询结果的排序方式与聚集索引的排序方式一致，聚集索引是ASC的，Sql Server就会采用FORWARD的方式，
　　　　也即是从左到右的Scan方式，找到满足1000条的数据后返回，查询终止
　　

　　　　如果是按照查询结果的倒序排序的方式查询

SELECT *

FROM ClusteredIndexScanDirection WITH (NOLOCK)

WHERE Col4 >=  '2017-7-18'

    AND Col4  <= '2017-7-23'

ORDER BY 1 DESC

OFFSET 0 ROWS FETCH NEXT 1000 ROWS ONLY

　　　　也就是要求查询结果的排序方式与聚集索引的排序方式不一致，聚集索引是ASC的，Sql Server就会采用BACKWARD的方式，
　　　　也即是从右到左的Scan方式，找到满足100条的数据后返回，查询终止

　　　　现在就存在一个问题，如果聚集索引是按照ASC正序排列的，也就是说在聚集索引排序一定的情况下，
　　　　聚集索引列和查询条件（CreateDate）上的时候都是递增的，也就是说，查询目标数据分布在B树的右边，
　　　　（当然这么说不严谨，物理存储中并没有左右的概念，这些都是逻辑上的，并不是完全物理上的概念），
　　　　实际业务中，差不多的意思就是查询最近N天的数据
　　　　如果查询结果是按照聚集索引正序排序，
　　　　Sql Server 采用FORWARD的方式，也即从左至右，那么这个查询就要经历B树种从左到右很大一部分数据扫描之后，才能找到所需要的数据
　　　　如果查询结果是按照聚集索引倒叙排序,
　　　　Sql Server 采用BACKWARD的方式，也即从右至左，那么这个查询直接从最右边开始Scan，很快就能找到符合条件的100条数据。
　　　　聚集索引是ASC或者DESC的方式，也会影响到这个查询，这些概念都是相对的，当然实际场景中，索引情况和查询条件可能更复杂，
　　　　可见，一个查询的实现，是通过FORWARD还是BACKWARD，跟聚集索引的排序方式和查询结果的排序方式，以及查询条件都有关。
　　　　Sql Server 选择FORWARD或者BACKWARD，本身都没有错，如果出现不同排序方式下性能差别非常大的时候，
　　　　就要注意到是不是，聚集索引的方式与查询排序方式之间存在类似上述的问题。
　　　　不管是FORWARD或者BACKWARD，避免让Scan整个表的大部分数据才找到符合条件的数据
　　　当然实际情况也比例子中复杂很多，还是那句话，具体情况具体分析。
　　　　比如业务系统查询数据时，排序方式是固定的（比如你网购的订单信息，总是按照时间倒叙排列的），当然也不排除其他情况
　　　　这就要求我们在创建聚集索引的时候，要考虑到查询的方式以及排序的方式，慎重地作出选择。

　总结：
　　　　SQLServer在对查询结果排序的查询中，如果扫描的方向与查询结果不一致，需要再次在内存中排序，
　　　　因此，大多数情况下，会根据查询结果的排序来执行FORWARD或者BACKWARD操作（当然也不一定百分百）。
　　　　本文通过聚集索引Scan的两种方式，FORWARD和BACKWARD，粗浅第分析了表上的聚集索引的排序对查询时的影响，
　　　　当然非聚集索引上也会出现FORWARD和BACKWARD扫描的请，
　　　我们在选择聚集索引排序方式的时候，可以考虑到是不是因为FORWARD和BACKWARD的因素，以便进一步的排查确认。

　　补充：

好吧，算我没说清楚，这里是按照聚集索引排序，按照非索引字段查询，而不是直接按照聚集索引字段查询！！！
我的例子已经写的很清楚了
如果聚集索引建立在一个字段上，也即单字段作为聚集索引，在非聚集索引字段上查询，暂不论这个字段上有没有索引
如果查询结果的跟聚集索引的排序方式是相同的，那么就是FORWARD
如果查询结果的跟聚集索引的排序方式是相反的，那么就是BACKWARD
不管是FORWARD还是BACKWARD，究竟要扫描多大范围才能找到符合条件的数据，
取决于上面说的非聚集索引字段列的数据分布,岂能说“ 正序和倒序无差别”？

其实我更想表达的是，因为结果集的排序，会导致在做聚集索引Scan的时候选择FORWARD或者BACKWARD
FORWARD还是BACKWARD会对查询的效率有较大的影响，
实际应用中太复杂了，当然修改聚集索引的排序方式可以从一定程度上缓解这种问题，我当然测试过，不然也不会乱说
也有其他方法也可以实现，比如暴力地去修改聚集索引列，或者建立复合聚集索引，办法也不仅限于此
如果还有不明白的，可以试试下面这个脚本，可以直接在你机器上执行，看看最后两个查询的IO代价
当然这个例子也比较极端

create table ClusteredIndexScanDirection

(

    Col1 int identity(1,1),

    Col2 varchar(50),

    Col3 varchar(50),

    Col4 Datetime

)

create unique clustered index idx_Col1 on ClusteredIndexScanDirection(Col1 ASC) 

DECLARE @date datetime,@i int=0

	set @date=GETDATE()

	while @i<1000000

	begin

	insert into ClusteredIndexScanDirection values (NEWID(),NEWID(),DATEADD(MI,@i,GETDATE()))

	set @i=@i+1

end

set statistics io on

SELECT *

FROM ClusteredIndexScanDirection WITH (NOLOCK)

WHERE Col4 >=  '2016-6-1'

	AND Col4  <= '2016-6-15'

ORDER BY Col1 ASC

OFFSET 0 ROWS FETCH NEXT 1000 ROWS ONLY  

SELECT *

FROM ClusteredIndexScanDirection WITH (NOLOCK)

WHERE Col4 >=  '2016-6-1'

	AND Col4  <= '2016-6-15'

ORDER BY Col1 DESC

OFFSET 0 ROWS FETCH NEXT 1000 ROWS ONLY

20160606再次后记：

A表上的索引大概是这样的：create index idx_date on A(BusinessDate )
这两个大表join，因为结果集的排序与其中一个主表（也是最大的表）的聚集索引一致
一致的话，他就是Forward方式的了，
但是，在逻辑上，最近的数据分布在B树的右边，那就是几乎要遍历整个表才能查询出来符合条件数据
为了避免这个问题，那就先对A表进行查询，将结果放入临时表
select * into #A from A where A.BusinessDate>'2016-6-1' and A.BusinessDate<'2016-6-6'
然后再在#A上建立相关索引，在跟其他表join，绕开直接join时走index Forward的方式进行查询
当然实际问题没这么简单，原始查询20多秒，采用这种方式优化后2s，差不多有十几倍的提高，效果还是比较明显的。

Sql Server 聚集索引扫描 Scan Direction的两种方式------FORWARD 和 BACKWARD的更多相关文章

SQL SERVER 聚集索引非聚集索引区别
转自http://blog.csdn.net/single_wolf_wolf/article/details/52915862 一.理解索引的结构索引在数据库中的作用类似于目录在书籍中的作用,用来 ...
SQL Server - 聚集索引 <第六篇>
聚集索引的叶子页存储的就是表的数据.因此,表行物理上按照聚集索引列排序,因为表数据只能有一种物理顺序,所以一个表只能有一个聚集索引. 当我们创建主键约束时,如果不存在聚集索引并且该索引没有被明确指定为 ...
浅谈sql server聚集索引与非聚集索引
今天同事的服务程序在执行批量插入数据操作时,会超时失败,代码debug了几遍一点问题都没有,SQL单条插入也可以正常录入数据,调试了一上午还是很迷茫,场面一度很尴尬,最后还是发现了问题的根本,原来是另 ...
从性能的角度谈SQL Server聚集索引键的选择
简介在SQL Server中,数据是按页进行存放的.而为表加上聚集索引后,SQL Server对于数据的查找就是按照聚集索引的列作为关键字进行了.因此对于聚集索引的选择对性能的影响就变得十分重要 ...
SQL server 聚集索引与主键的区别
主键是一个约束(constraint),他依附在一个索引上,这个索引可以是聚集索引,也可以是非聚集索引. 所以在一个(或一组)字段上有主键,只能说明他上面有个索引,但不一定就是聚集索引. 例如下面: ...
C#连接sql server windows 和 sqlserver 身份验证的两种连接字符串
//sql server 身份验证连接字符串 private string ConnstrSqlServer = "server=服务器名称;uid=登录名称;pwd=登录密码;datab ...
SQL Server 2008 R2占用内存越来越大两种解决方法
SQL Server 2008 R2运行越久,占用内存会越来越大. 第一种:有了上边的分析结果,解决方法就简单了,定期重启下SQL Server 2008 R2数据库服务即可,使用任务计划定期执行下边 ...
Sql Server聚集索引创建
create CLUSTERED index IX_ZhuiZIDList_ZID on ZhuiZIDList (ZID)
【sql server】索引详解
索引可以理解为一种特殊的目录结构. sql server提供两种索引形式: 聚集索引和非聚集索引. 怎么理解这两种形式. 拿我们常用的字典举例来说, 一个字典好比数据库中的一个表.那么当我们想从字典中 ...

随机推荐

快速定位性能瓶颈，检查出所有资源（CPU、内存、磁盘IO等）的利用率（utilization）、饱和度（saturation）和错误（error）度量,即USE方法
命令:uptime说明:查看机器分别在1分钟.5分钟.15分钟的平均负载情况,显示的数字表示等待cpu资源的进程和阻塞在不可中断io进程的数量,如果1分钟的平均负载很高,而15分钟的平均负载很低,说明 ...
深入理解OAuth2.0协议
1. 引言如果你开车去酒店赴宴,你经常会苦于找不到停车位而耽误很多时间.是否有好办法可以避免这个问题呢?有的,听说有一些豪车的车主就不担心这个问题.豪车一般配备两种钥匙:主钥匙和泊车钥匙.当你到酒店 ...
HW2016_字符串_STL_DP
一.在字符串str1中删除那些在str2中出现的字符. str2可能会有重复字符,直接遍历会导致效率低下,故先借助STL的set容器对str1查重: 然后,遍历str1和str2,对str1进行查重. ...
有Maple T.A.自有试题图so easy
对于想完全控制试题库的用户而言,Maple T.A.是最好的选择.不论您是要利用现有的题库,还是要创建自己的题库,Maple T.A.都可以为您提供功能强大.操作便捷的工具创建数学内容. 1) Ste ...
MySQL 注册码
最近开发是用MySQL数据库,之前安装后,每次打开Navicat Premium 都提示 “试用一个月”,“ 注册”,然后为了方便,就都选择了试用的, 一个月后,就必须的输入注册码,(还有一个是什 ...
.NET不可变集合已经正式发布
微软基础类库(Base Class Library)团队已经完成了.NET不可变集合的正式版本,但不包括ImmutableArray.与其一起发布的还包括针对其它不可变对象类型的设计指南. 如果你需要 ...
Android-Notification-简单的demo
通知,几乎存在于每一个 Android 的应用中,新闻客户端来一条新闻的时候会给你发一条通知,QQ.微信有新消息来的时候会给你发一条通知,反正,通知就像魔鬼般一直缠绕在我们的左右.所以,Android ...
KnockoutJS 3.X API 第八章映射(mapping)插件
Knockout旨在允许您将任意JavaScript对象用作视图模型. 只要一些视图模型的属性是observables,您可以使用KO将它们绑定到您的UI,并且UI将在可观察属性更改时自动更新. 大多 ...
Sql Server系列：触发器
触发器的一些常见用途: ◊ 强制参照完整性 ◊ 常见审计跟踪(Audit Trails):这意味着写出的记录不仅跟踪大多数当前的数据,还包括对每个记录进行实际修改的历史数据. ◊ 创建与CHECK约束 ...
LINQ系列：LINQ to SQL Take/Skip
1. Take var expr = context.Products .Take(); var expr = (from p in context.Products select p) .Take( ...

Sql Server 聚集索引扫描 Scan Direction的两种方式------FORWARD 和 BACKWARD

Sql Server 聚集索引扫描 Scan Direction的两种方式------FORWARD 和 BACKWARD的更多相关文章

随机推荐

热门专题