SQLSERVER 里SELECT COUNT(1) 和SELECT COUNT(*)哪个性能好？

今天遇到某人在我以前写的一篇文章里问到

如果统计信息没来得及更新的话，那岂不是统计出来的数据时错误的了

这篇文章的地址：SQLSERVER是怎麽通过索引和统计信息来找到目标数据的(第三篇)

之前我以为SELECT COUNT(*)是根据统计信息来的，但是后来想了一下，这个肯定不是

那么SQLSERVER怎麽统计SELECT COUNT(*)的呢？？

其实SQLSERVER也是使用扫描的方法

大家也可以先看一下：SQLSERVER中的ALLOCATION SCAN和RANGE SCAN

但是这里不讨论是ALLOCATION SCAN还是RANGE SCAN，大家知道SQLSERVER使用的是扫描的方式就可以了

聚集索引表

SQL脚本如下：

 USE [pratice]

 GO

 --建立聚集索引表

 CREATE TABLE ct1(c1 INT, c2 VARCHAR (2000));

 GO

 --建立聚集索引

 CREATE CLUSTERED INDEX t1c1 ON ct1(c1);

 GO

 --插入测试数据

 DECLARE @a INT;

 SELECT @a = 1;

 WHILE (@a <= 12)

 BEGIN

     INSERT INTO ct1 VALUES (@a, replicate('a', 2000))

     SELECT @a = @a + 1

 END

 GO

 --查询数据

 SELECT * FROM ct1

看一下执行计划

（图片一）

 SET STATISTICS PROFILE ON

 GO

 SELECT COUNT(*) FROM [dbo].[ct1]

（图片二）

这里需要了解流聚合运算符

MSDN对于流聚合运算符的解释

（图片三）

宋沄剑的文章里也有对流聚合运算符的解释

SQL Server中的执行引擎入门

重点是理解：Stream Aggregate 运算符按一列或多列对行分组，然后计算由查询返回的一个或多个聚合表达式

Stream Aggregate 运算符按一列对行分组，然后计算由查询返回的一个聚合表达式

我们用下面两个图会清楚一些

（图片四）

（图片五）

SQLSERVER对表中的行分组进行扫描，但是SQLSERVER以多少行为一组来进行扫描呢？？这个不得而知了

为什麽要使用流聚合？

大家一定会自然而然地想到分组统计提高性能，特别是表中数据量非常大的时候，分组统计特别有用

计算标量运算符只是把聚合的结果隐式转换为int类型

大家知道ct1表只有两列，但是SELECT COUNT(3) FROM [dbo].[ct1]也能够返回表中的行数

 SELECT COUNT(1) FROM [dbo].[ct1]

 SELECT COUNT(3) FROM [dbo].[ct1]

（图片六）

就算用列名都是一样的执行计划

 SELECT COUNT(c1) FROM [dbo].[ct1]

 SELECT COUNT(c2) FROM [dbo].[ct1]

（图片七）

SQLSERVER究竟以哪一列来进行表的行数统计的呢？？？？？？

答案就在

Stream Aggregate 运算符要求输入的数据要按某列进行排序，如果由于前面的 Sort 运算符或已排序的索引查找或扫描导致数据尚未排序，

则优化器将在此运算符前面使用一个 Sort 运算符，使表的某列是有序排序的。

 SELECT  COUNT(*)

 SELECT  count（3）

 SELECT  count（c2）

（图片八）

上面三个SQL语句都是按照聚集索引的第一个字段（ct1表中的c1列）来进行统计的

因为聚集索引的第一个字段是根据建立聚集索引的时候的排序顺序预先排好序

Stream Aggregate 运算符要求输入的数据要按某列进行排序

所以无论是指定字段名、*还是数字，都是根据聚集索引的第一个字段来统计

堆表

SQL脚本如下:

 CREATE TABLE t1(c1 INT, c2 VARCHAR (8000));

 GO

 --插入测试数据

 DECLARE @a INT;

 SELECT @a = 1;

 WHILE (@a <= 12)

 BEGIN

     INSERT INTO t1 VALUES (@a, replicate('a', 5000))

     SELECT @a = @a + 1

 END

 GO

 --查询数据

 SELECT * FROM t1

（图片九）

（图片十）

堆表这里使用的是ALLOCATION SCAN

因为分配页面的时候是根据c1列的值从1~12进行分配的

（图片十一）

109页面存放的c1值是1

120页面存放的c1值是2

174页面存放的c1值是3

193页面存放的c1值是4

8316页面存放的c1值是5

8340页面存放的c1值是6

8351页面存放的c1值是7

8353页面存放的c1值是8

。

（图片十二）

这里执行计划在流聚合之前并没有进行排序的原因：因为建表进行页面分配的时候已经按照C1列的值进行有序的页面分配

所以当ALLOCATION SCAN的时候，C1列已经是有序的了

（图片十三）

不明白的童鞋可以再看一下：SQLSERVER中的ALLOCATION SCAN和RANGE SCAN

为什麽SQLSERVER选择统计C1列的值，因为C1列的值是可以排序的，C2列不能排序，统计不了

那么如果一个表中没有可以用来排序的列呢????

先drop掉t1表，再建立t1表，脚本如下：

 CREATE TABLE t1(c1 VARCHAR (2), c2 VARCHAR (8000));

 GO

 --插入测试数据

 DECLARE @a INT;

 SELECT @a = 1;

 WHILE (@a <= 12)

 BEGIN

     INSERT INTO t1 VALUES ('a', replicate('a', 5000))

     SELECT @a = @a + 1

 END

 GO

 --查询数据

 SELECT * FROM t1

结果是

（图片十四）

我觉得SQLSERVER应该会在表中加上一列，类似用来区分聚集索引页面重复值的UNIQUIFIER(KEY)列

当查询完毕之后就删除掉这一列

（图片十五）

非聚集索引表

SQL脚本如下:

 CREATE TABLE nct1(c1 INT, c2 VARCHAR (8000));

 GO

 --建立非聚集索引

 CREATE  INDEX nt1c1 ON nct1(c1);

 GO

 --插入数据

 DECLARE @a INT;

 SELECT @a = 1;

 WHILE (@a <= 10)

 BEGIN

     INSERT INTO nct1 VALUES (@a, replicate('a', 5000))

     SELECT @a = @a + 1

 END

 GO

 --查询数据

 SELECT * FROM [dbo].[nct1]

（图片十六）

大家一定要记住:非聚集索引是建立在c1列上的!!!

下面两个SQL语句都是一样的,都是根据c1列的值进行统计,而SQLSERVER只扫描非聚集索引页面,而不扫描数据页面

 SELECT  COUNT(*) FROM [dbo].[nct1]

 SELECT  COUNT(3) FROM [dbo].[nct1]

SELECT COUNT(*) FROM [dbo].[nct1]是不需要到数据页面去读取c2列的数据的,只需要扫描非聚集索引页面（c1列）就可以了

SELECT COUNT(3) FROM [dbo].[nct1]跟SELECT COUNT(*) FROM [dbo].[nct1]也是一样

不知道大家还记得书签查找不，如果SQLSERVER扫描了非聚集索引页面之后还需要到数据页面去读取其他字段的数据的话，就需要RID查找运算符

（图片十七）

SQLSERVER聚集索引与非聚集索引的再次研究（下）

SELECT COUNT(*) FROM [dbo].[nct1]和SELECT COUNT(3) FROM [dbo].[nct1]的扫描方式跟前面说的聚集索引表是差不多的

这里就不一一叙述了~

而SELECT COUNT(c2) FROM [dbo].[nct1]为什麽会用表扫描呢？

 SELECT  COUNT(c2) FROM [dbo].[nct1]

c2列不在非聚集索引页面里，所以需要表扫描

（图片十八）

SELECT COUNT(c2) FROM [dbo].[nct1]跟前面说的堆表是差不多的，这里就不一一叙述了

总结

做了这麽多实验

可以总结出：select count(*)、count(数字)、count(字段名)是没有性能差别的！！

我说的没有差别是在相同的条件下，就像非聚集索引表，如果使用

SELECT COUNT(c2) FROM [dbo].[nct1]

跟SELECT COUNT(*) FROM [dbo].[nct1]、SELECT COUNT(3) FROM [dbo].[nct1]相比肯定有差别

因为SELECT COUNT(c2) FROM [dbo].[nct1]走的是表扫描

如果SELECT COUNT(c1) FROM [dbo].[nct1]

跟SELECT COUNT(*) FROM [dbo].[nct1]、SELECT COUNT(3) FROM [dbo].[nct1]相比是没有差别的

（图片十九）

大家走的都是非聚集索引扫描

无论是聚集索引表、堆表、非聚集索引表都是扫描表中的记录来统计出表中的行数的

希望大家看完这篇文章之后，不再一知半解了，这是我的希望o(∩_∩)o

如有不对的地方，欢迎大家拍砖o(∩_∩)o

-----------------------------------------------------------------------

补上IO和时间的比较 2013-10-19

---------------------------------

聚集索引表

 SET STATISTICS IO ON

 SET STATISTICS TIME ON

 GO

 SELECT COUNT(*) FROM [dbo].[ct1]

 SQL Server 分析和编译时间:

    CPU 时间 = 0 毫秒，占用时间 = 2 毫秒。

 (1 行受影响)

 表 'ct1'。扫描计数 1，逻辑读取 5 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

 SQL Server 执行时间:

    CPU 时间 = 15 毫秒，占用时间 = 2 毫秒。

 SET STATISTICS IO ON

 SET STATISTICS TIME ON

 GO

 SELECT COUNT(1) FROM [dbo].[ct1]

 SQL Server 分析和编译时间:

    CPU 时间 = 0 毫秒，占用时间 = 2 毫秒。

 (1 行受影响)

 表 'ct1'。扫描计数 1，逻辑读取 5 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SET STATISTICS IO ON

 SET STATISTICS TIME ON

 GO

 SELECT COUNT(c1) FROM [dbo].[ct1]

 SQL Server 分析和编译时间:

    CPU 时间 = 0 毫秒，占用时间 = 1 毫秒。

 (1 行受影响)

 表 'ct1'。扫描计数 1，逻辑读取 5 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

---------------------------------------------------

堆表

 SET STATISTICS IO ON

 SET STATISTICS TIME ON

 GO

 SELECT COUNT(*) FROM [dbo].[t1]

 SQL Server 分析和编译时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 分析和编译时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 (1 行受影响)

 表 't1'。扫描计数 1，逻辑读取 12 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SET STATISTICS IO ON

 SET STATISTICS TIME ON

 GO

 SELECT COUNT(1) FROM [dbo].[t1]

 SQL Server 分析和编译时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 分析和编译时间:

    CPU 时间 = 0 毫秒，占用时间 = 79 毫秒。

 (1 行受影响)

 表 't1'。扫描计数 1，逻辑读取 12 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SET STATISTICS IO ON

 SET STATISTICS TIME ON

 GO

 SELECT COUNT(c1) FROM [dbo].[t1]

 SQL Server 分析和编译时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 分析和编译时间:

    CPU 时间 = 0 毫秒，占用时间 = 1 毫秒。

 (1 行受影响)

 表 't1'。扫描计数 1，逻辑读取 12 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

-----------------------------------------------------------------------------------------

非聚集索引表

 SET STATISTICS IO ON

 SET STATISTICS TIME ON

 GO

 SELECT COUNT(*) FROM [dbo].[nct1]

 SQL Server 分析和编译时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 分析和编译时间:

    CPU 时间 = 0 毫秒，占用时间 = 1 毫秒。

 (1 行受影响)

 表 'nct1'。扫描计数 1，逻辑读取 2 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SET STATISTICS IO ON

 SET STATISTICS TIME ON

 GO

 SELECT COUNT(1) FROM [dbo].[nct1]

 SQL Server 分析和编译时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 分析和编译时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 (1 行受影响)

 表 'nct1'。扫描计数 1，逻辑读取 2 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 49 毫秒。

 SET STATISTICS IO ON

 SET STATISTICS TIME ON

 GO

 SELECT COUNT(c1) FROM [dbo].[nct1]

 SQL Server 分析和编译时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 SQL Server 分析和编译时间:

    CPU 时间 = 0 毫秒，占用时间 = 0 毫秒。

 (1 行受影响)

 表 'nct1'。扫描计数 1，逻辑读取 2 次，物理读取 0 次，预读 0 次，lob 逻辑读取 0 次，lob 物理读取 0 次，lob 预读 0 次。

 SQL Server 执行时间:

    CPU 时间 = 0 毫秒，占用时间 = 1 毫秒。

2014-6-21补充：

USE [sss]

--建表

CREATE TABLE counttb ( id INT NULL )

--插入数据

INSERT  INTO [dbo].[counttb]

        ( [id] )

        SELECT  1

        UNION ALL

        SELECT  NULL 

--统计行数

SELECT  COUNT(1) ,

        COUNT(*) ,

        COUNT(id)

FROM    [dbo].[counttb]

--查询索引的统计值

SELECT  a.[rowcnt] ,

        b.[name]

FROM    sys.[sysindexes] AS a

        INNER JOIN sys.[objects] AS b ON a.[id] = b.[object_id]

WHERE   b.[name] = 'counttb'

--创建非聚集索引

CREATE INDEX ix_counttb_id ON [dbo].[counttb] (id)

--统计行数

SELECT  COUNT(1) ,

        COUNT(*) ,

        COUNT(id)

FROM    [dbo].[counttb]

因为在创建非聚集索引前和创建非聚集索引后的行数值都是一样的，可以看出COUNT(*) COUNT(1) 和COUNT(ID)

的统计方式不一样，所以没有可比性

一般我们在统计行数的时候都会把NULL值统计在内的，所以这样的话，最好就是使用COUNT(*) 和COUNT(1) ，这样的速度最快！！

SQLSERVER 里SELECT COUNT(1) 和SELECT COUNT(*)哪个性能好？的更多相关文章

JS中Float类型加减乘除修复 JQ 操作 radio、checkbox 、select LINQ to SQL:Where、Select/Distinct LINQ to SQL Count/Sum/Min/Max/Avg Join
JS中Float类型加减乘除修复 MXS&Vincene ─╄OvЁ &0000027─╄OvЁ MXS&Vincene MXS&Vincene ─╄Ov ...
PHP基础语法: echo,var_dump, 常用函数：随机数：拆分字符串:explode()、rand()、日期时间：time()、字符串转化为时间戳：strtotime()可变参数的函数：PHP里数组长度表示方法：count($attr[指数组])；字符串长度：strlen($a)
PHP语言原理:先把代码显示在源代码中,再通过浏览器解析在网页上 a. 1.substr; //用于输出字符串中,需要的某一部分 <?PHP $a="learn php"; ...
sqlserver不能直接create table as select
sqlserver不能直接create table as select 在sqlserver 下想复制一张表的,想到oracle下直接create table xxx as select * from ...
COUNT(*),count(1),COUNT(ALL expression)，COUNT(DISTINCT expression)
创建一个测试表 IF OBJECT_ID( 'dbo.T1' , 'U' )IS NOT NULL BEGIN DROP TABLE dbo.T1; END; GO )); GO INSERT INT ...
SQLSERVER 里经常看到的CACHE STORES是神马东东？
SQLSERVER 里经常看到的CACHE STORES是神马东东? 当我们在SSMS里执行下面的SQL语句清空SQLSERVER的缓存的时候,我们会在SQL ERRORLOG里看到一些信息 DBCC ...
用SQLSERVER里的bcp命令或者bulkinsert命令也可以把dat文件导入数据表
用SQLSERVER里的bcp命令或者bulkinsert命令也可以把dat文件导入数据表下面的内容的实验环境我是在SQLSERVER2005上面做的之前在园子里看到两篇文章<C# 读取纯真 ...
MySQL select into 和 SQL select into
现在有张表为student,我想将这个表里面的数据复制到一个为dust的新表中去,虽然可以用以下语句进行复制,总觉得不爽,希望各位帮助下我,谢谢. answer 01: create table d ...
hql中不能写count(1)能够写count(a.id)
hql中不能写count(1)能够写count(a.id)里面写详细的属性 String hql="select new com.haiyisoft.vo.entity.cc.repo.Bu ...
mybatis中union可以用if判断连接，但是<select>中第一个select语句不能被if判断，因此可以从dual表中查询null来凑齐。union如果使用order by排序，那么只能放在最后一个查询语句的位置，并且不能带表名。
 <select id="yzdznsrlistPage" parameterType="page" r ...

随机推荐

Jquery动态在td中添加checkbox
如图:想要在这个id为headId的<td>中,用jquery动态添加checkbox 代码如下 : data是我用ajax 从后台获取的数据,里面含有若干个user类,我想把所有的人名字 ...
HTTP 协议缓存
http 缓存分为客户端缓存和服务端缓存 1. 客户端缓存客户端缓存指的是浏览器缓存, 浏览器缓存是最快的缓存, 因为它直接从本地获取(但有可能需要发送一个请求), 它的优势是可以减少网络流量, 加 ...
我总结的git命令指南。
git命令行指南 1.windows上安装git的网址:http://msysgit.github.com/. 没有安装过git的这个网址里下mymsgit. 因为发现有些同学对git还不是那么熟悉 ...
null 和 NULL 判断
遇到问题,服务器传回 null,我擦嘞,接收不了. 解决如下: NULL 直接判断就好,能在 xcode 上直接敲出 null 的话可以 ==[NSNull class] 或者[respons ...
odoo10 费用报销
odo10 对费用报销进行了改进,恢复了 8.0 及之前版本具有的单个报销包含多个明细内容的功能. 使用步骤大致如下: 根据管理需要设立相应的科目和分析帐户科目分析帐户建立费用目录员工录 ...
AndroidLinker与SO加壳技术之上篇
1. 前言 Android 系统安全愈发重要,像传统pc安全的可执行文件加固一样,应用加固是Android系统安全中非常重要的一环.目前Android 应用加固可以分为dex加固和Native加固,N ...
java Thumbnails 加载网络图片，处理返回base64
URL url = new URL("图片网络地址"); BufferedInputStream in = new BufferedInputStream(url.openStre ...
db2设置共享内存
db2 UPDATE DBM CFG USING INSTANCE_MEMORY 5242880 IMMEDIATEdb2 UPDATE DBM CFG USING INSTANCE_MEMORY A ...
Unity3d Android Http 开发中的坑（吐槽
在一般的U3D网络开发中,直接使用WWW类便足够正常使用,但我在发现使用WWW下载大文件时,会导致整个程序卡顿的情况(不清楚是否我个人电脑问题),所以干脆使用HttpWebRequest/HttpWe ...
js 常见混乱
slice(begin.end) 复制出一个新的数组或是一个新的字符串,其中end 不包括end本身 splice(begin,howmany,item1....itemn) 更改原先的array 会 ...

SQLSERVER 里SELECT COUNT(1) 和SELECT COUNT(*)哪个性能好？

SQLSERVER 里SELECT COUNT(1) 和SELECT COUNT(*)哪个性能好？

SQLSERVER 里SELECT COUNT(1) 和SELECT COUNT(*)哪个性能好？的更多相关文章

随机推荐

热门专题