SQL Server索引进阶:第一级,索引简介
这个并不是我翻译的,全文共有15篇,但我发现好多网站已经不全,所以自己整理。
原文地址:
Stairway to SQL Server Indexes: Level 1, Introduction to Indexes
本文是SQL Server索引进阶系列(Stairway to SQL Server Indexes)的一部分。
索引是数据库设计的基础,向开发者显示了使用数据库大量数据库设计者的意图。不幸的是,索引大部分时候是在出现性能问题的时候,才被事后添加上的。
第一级介绍一下SQL Server的索引:是一种数据库对象,使得SQL Server可以在最短的时间内查询 or 修改请求的数据,使用最少的系统资源带来最大的性能提升。好的索引将会允许SQL Server实现最大化的并发,一个用户的查询对于其他用户的查询几乎没有影响。最终,索引给数据库完整性提供一种高效的方式,当唯一索引创建的时候,确保唯一的键值。这一级只是一个简介,包括一些理论和使用,一些物理的细节留在后面的级别中介绍。
对于数据库开发者来说,彻底的理解索引是重要的,当一个请求从客户端到达SQL Server,SQL Server只有两种可能的路径来访问请求的数据行:
- 扫描包含数据的表中的每一行,从第一行到最后一行,检查每一行是否满足请求的条件。
- 如果包含可用的索引,可以用索引来定位请求的数据。
第一种方法对于SQL Server来说总是可用的,第二种方法只在你给数据库设计了可用的索引的情况下才是可行的,但是第二种可以带来极大地性能提升,接下来我们将继续介绍。
因为索引需要维护(它们会占用物理空间,并且它们一定会和表保持同步),所以它们不是SQL Server必须的。有的数据库会完全没有索引。它们可能会导致性能下降,有可能带来数据完整性问题,但是SQL Server允许它的存在。
但是,这些不好的不是我们想要的。我们都希望数据库性能优良,数据完整,同时,保持索引维护的最小化。本级别将会朝着这个目标引导大家。
数据库实例
贯穿整个进阶系列,我们都会使用实例来阐述关键的理念。这些例子使用的是微软的 AdventureWorks 示例数据库。我们主要使用销售订单部门。包含5张表:Customer, SalesPerson, Product, SalesOrderHeader, SalesOrderDetail。为了保持注意力的集中,我们使用部分的列。
AdventureWorks 设计的很规范,销售人的信息在三张表中都有:SalesPerson,Employee,Contact。在某些情况下,我们会把他们看成是一张表。下图是这些表之间的关系。
什么是索引
通过一个小故事开始我们的索引学习之旅,一个很老,但是证明很技术,贯穿整篇本章,介绍索引的基本概念。
你离开家去处理一些事情。当你回来的时候,从等待你回来的女儿的垒球教练口中得到一些消息。三个女孩子:Tracy, Rebecca, and Amy弄丢了他们的帽子。你能否给他们买帽子,下一场比赛他们的父母将会还给你。
你认识那些女孩子,也认识他们的父母。但是你不知道他们帽子的尺寸。在你家的镇子上有三家人,每家都有一些你需要的信息。没有问题,你会打电话给他们,得到帽子的尺寸。你一手拿着电话,一边打开电话本的目录索引。
你需要联系的第一家是Hellen Meyer,你估计Meyer应该在姓名的中部,你直接跳到电话本的中间部分,但是你发现来到了页头部写着“Kline-Koerber”的一页,向前翻了几页,又发现了“Nagle-Nyeong”,又向前翻了几页,发现了“Maldonado-Nagle”。意识到你快要找到了,向后查找,你找到了“Meyer,Helen”一行,找到的对应的号码。打通了Meyer的家,得到了你想要的信息。
重复上面的过程,找到了另外两个家庭,获取了另外两个帽子的尺寸。
你使用了索引,你使用索引的方式和SQL Server使用索引的方式类似。他们有很多的相似,有一些不同,电话本和SQL Server的索引。
事实上,你刚才使用的就是SQL Server两种索引(聚集和非聚集)中的一种,非聚集索引。本级别我们介绍非聚集索引,下一级别介绍聚集索引,以及深入的分析这两种索引。
非聚集索引
白纸类似非聚集索引,他们不是以数据本身来组织的,只是一个映射,帮助你访问数据。数据本身才是我们真正需要的。电话公司没有将镇子的居民整理到一个有意义的队列中,将房子从一个地方移动到另一个地方,方便同一个垒球队的女孩们的家是一个挨一个的,而不是像现在这样用居民的姓氏来组织。相反,他给你一本书,包含每个居民。每行都包含一个键,使得你可以访问到居民的电话。
就像白纸上的电话一样,SQL Server的非聚集索引都包含两部分的内容:
查询键,例如:姓氏-名称-中间部分这样的格式,在SQL Server的词汇中,叫做索引键。
标签,提供相同的内容,那就是电话号码,SQL Server中则直接指向键代表的数据行。
另外,一个SQL Server非聚集索引还会包含一些内部使用的头部信息,可能会包含一些可选的信息。这些内容在后面的级别中会有介绍,现在还不是理解非聚集索引的重点内容。
就像电话本一样,SQL Server的索引维护一个查询键,经过几次小的跳转就会找到想要访问的入口。给出一个查询键,SQL Server可以快速的定位入口。不像电话本,SQL Server的索引是动态的。那就是说,每次增加一行,删除一样,或者是包含查询键的一列被修改,SQL Server都会更新索引。
就像在电话本上两个挨着的家庭,在地理位置上不是挨着的一样,在非聚集索引中挨着的两个入口,也不是表中挨着的两行数据。第一个入口可能是表中的最后一行,第二个入口可能是表中的第一行。事实上,不想索引,入口通常是有意义的序列。表中的行是完全无序的。
当我们创建一个索引,SQL Server会产生并且在额外的表中精确的维护每一行的入口。在一张表可以创建多于一个的非聚集索引。
最大的不同是:SQL Server不能使用电话。他只会使用标签中的信息,才可以导航到对应的表中的行。
创建并且从非聚集索引中受益
我们通过两次示例数据库的查询来结束这个级别,确保你使用的示例数据库是SQL Server 2005的AdventureWorks 数据库,也可以是SQL Server 2008。每次我们会执行相同的查询,但是第一次是在创建索引之前,第二次是在创建索引之后。每一次,SQL Server都会告诉我们获取数据需要做多少工作。我们将在Contact表中查询Helen Meyer行(大概在表的中间部分)。初始时候,在FirstName或者是LastName列没有索引,为了确保执行正确,可以通过下面的代码来删除索引。
IF EXISTS (SELECT * FROM sys.indexes
WHERE OBJECT_ID = OBJECT_ID('Person.Contact')
AND name = 'FullName')
DROP INDEX Person.Contact.FullName;
开启IO和时间统计
SET STATISTICS io ON
SET STATISTICS time ON
GO
执行查询
SELECT *
FROM Person.Contact
WHERE FirstName = 'Helen'
AND LastName = 'Meyer';
GO
我们会看到执行结果,也就是Helen的信息。
在消息tab中我们会看到
表 'Contact'。扫描计数 1,逻辑读取 561 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。 SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 9 毫秒。
信息中显示本次查询产生逻辑IO 561次,处理器占用9毫秒的时间。你显示的内容会和处理器的不同而不同。
建立非聚集索引
CREATE NONCLUSTERED INDEX FullName
ON Person.Contact
( LastName, FirstName );
GO
再次执行查询
SELECT *
FROM Person.Contact
WHERE FirstName = 'Helen'
AND LastName = 'Meyer';
GO
这次看到的信息变成了
表 'Contact'。扫描计数 1,逻辑读取 4 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。 SQL Server 执行时间:
CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。
建立索引之后只需要4次逻辑IO,更少的处理器占用时间。
结论
创建合适的索引可以极大的提升数据库性能。在下一级别,我们会了解索引的物理结构。我们将会知道非聚集索引为什么会对查询有好处。还会介绍其他类型的索引,索引的其他好处,索引相关的代价,监控和维护索引,和一些最佳实践。目标就是告诉你建立索引所必须的知识。
SQL Server索引进阶:第一级,索引简介的更多相关文章
- SQL Server 解读【已分区索引的特殊指导原则】(3) - 非聚集索引分区
一.前言 在MSDN上看到一篇关于SQL Server 表分区的文档:已分区索引的特殊指导原则,如果你对表分区没有实战经验的话是比较难理解文档里面描述的意思.这里我就里面的一些概念进行讲解,方便大家的 ...
- SQL Server 解读【已分区索引的特殊指导原则】(2)- 唯一索引分区
一.前言 在MSDN上看到一篇关于SQL Server 表分区的文档:已分区索引的特殊指导原则,如果你对表分区没有实战经验的话是比较难理解文档里面描述的意思.这里我就里面的一些概念进行讲解,方便大家的 ...
- SQL Server数据库性能优化之索引篇【转】
http://www.blogjava.net/allen-zhe/archive/2010/07/23/326966.html 性能优化之索引篇 近期项目需要, 做了一段时间的SQL Server性 ...
- SQL server 表中如何创建索引?
SQL server 表中如何创建索引?看个示例,你就会了 use master goif db_id(N'zhangxu')is not nulldrop database zhangxugocre ...
- SQL Server查询性能优化——覆盖索引(二)
在SQL Server 查询性能优化——覆盖索引(一)中讲了覆盖索引的一些理论. 本文将具体讲一下使用不同索引对查询性能的影响. 下面通过实例,来查看不同的索引结构,如聚集索引.非聚集索引.组合索引等 ...
- SQL Server查询性能优化——创建索引原则(一)
索引是什么?索引是提高查询性能的一个重要工具,索引就是把查询语句所需要的少量数据添加到索引分页中,这样访问数据时只要访问少数索引的分页 就可以.但是索引对于提高查询性能也不是万能的,也不是建立越多的索 ...
- SQL Server 性能优化之——重复索引
原文 http://www.cnblogs.com/BoyceYang/archive/2013/06/16/3139006.html 阅读导航 1. 概述 2. 什么是重复索引 3. 查找重复索引 ...
- SQL Server 查询性能优化——创建索引原则(一)(转载)
索引是什么?索引是提高查询性能的一个重要工具,索引就是把查询语句所需要的少量数据添加到索引分页中,这样访问数据时只要访问少数索引的分页就可以.但是索引对于提高查询性能也不是万能的,也不是建立越多的索引 ...
- SQL Server 查询性能优化——创建索引原则(一)
索引是什么?索引是提高查询性能的一个重要工具,索引就是把查询语句所需要的少量数据添加到索引分页中,这样访问数据时只要访问少数索引的分页就可以.但是索引对于提高查询性能也不是万能的,也不是建立越多的索引 ...
- SQL Server 2016 —— 聚集列存储索引的功能增强
作者 Jonathan Allen,译者 邵思华 发布于 2015年6月14日 聚集列存储索引(CC Index)是SQL Server 2014中两大最引 ...
随机推荐
- 0x800a138f - JavaScript runtime error: Unable to get property 'asSorting' of undefined or null reference 错误原因以及解决办法
使用Jquery Datatables的时候也许会碰到这样的错误提示,当我们仔细的查找代码,发现引用的js文件,css文件均引用了,就是找不到他的问题所在. 这是从我们引用的js文件内部报的错. 这个 ...
- J2SE知识点摘记(二十四)
覆写hashCode() 在明白了HashMap具有哪些功能,以及实现原理后,了解如何写一个hashCode()方法就更有意义了.当然,在HashMap中存取一个键值对涉及到的另外一个方法为equa ...
- Windows Azure Web Role 的 IIS 重置
如果您是一名 Web开发人员,您很可能使用过"简单快捷"的iisreset命令重置运行不正常的 IIS主机.这种方法通常在经典的 Windows Server VM上非常有效 ...
- Android之SplashActivity的巧妙之处
众所周知,我们很多应用都会有一个SplashActivity,用来当作进入应用的第一个过度界面,显示一个logo信息.如下所示,是我的简洁天气的SplashActivity. 但是,它的作用仅仅只是用 ...
- 机器学习Matlab打击垃圾邮件的分类————朴素贝叶斯模型
该系列来自于我<人工智能>课程回顾总结,以及实验的一部分进行了总结学习机 垃圾分类是有监督的学习分类最经典的案例,本文首先回顾了概率论的基本知识.则以及朴素贝叶斯模型的思想.最后给出了垃圾 ...
- oracle tns
oracle tns 是oracle提供的服务名,设置方法,oracle安装根目录---product----版本选择11.2.0----client1---NETWORK---ADMIN---tns ...
- JavaSE思维导图(五)
- pycharm中添加扩展工具pylint
今天调试了好几个小时,想吧pylint集成到pycharm中去,从网上找了个宝贝帖 子,但是不好用,原因是作者写的脚本是检查工程和模块的,而我的是单独检查一个文件,当然前者肯定会在项目后期用的.所以就 ...
- PDF417码制尺寸定义
PDF417码制尺寸定义 1.模块宽度(X)不得小于0.191mm,你们目前所用300dpi打印机点的尺寸是0.084 mm * 0.01 mm,可 三倍以上值 2.条 ...
- Oracle中如何判断字符串是否全为数字,以及从任意字符串中提取数字
本文介绍了判断字符串是否全为数字的4种办法,另外还介绍了一个translate函数的小技巧,从任意字符串中提取数字(调用2次translate函数).这个办法是一个公司同事发现的,用起来很方便,但理解 ...