前言

上一节我们结束了Hash Match Aggregate和Stream Aggregate的讲解,本系列我们来讲讲关于SQL Server中的计算列问题,简短的内容,深入的理解,Always to review the basics。

初探计算列持久化(Compued Column Persisted)

在SQL Server 2005就引入了计算列,我们首先稍微看下在msdn关于计算列的定义:计算列由可以使用同一表中的其他列的表达式计算得来。表达式可以是非计算列的列名、常量、函数,也可以是用一个或多个运算符连接的上述元素的任意组合。表达式不能为子查询。实际上就是为了定义一个列来对其他列来进行计算可以是列名、函数等,那么它的使用场景是什么呢?下面我们首先来举个例子。当需要导出一些值时,此时这些值需要通过计算才能被导出,同时呢,有一些列还依赖于另外的一列或者更多列,如果一个列进行了更新则其依赖的列必须同步进行更新,上述场景通过对一个列或者多个列进行计算,此时我们需要定义一个将一个列或者多个列进行计算得到的值的列,这就是计算列。我们来看一个典型的例子,在一个公司上班的所有员工,在公司内部系统中会存其所有员工的信息,比如员工编号、出生日期等,如果此时我们需要导出员工的退休日期呢,假设在中国现在男性退休时间为60年后,此时我们需要通过出生日期算出60年后的日期,也就说在表中还需要定义一个退休日期列。下面我们创建表来看看计算列。

USE TSQL2012
GO CREATE TABLE Employee
(
employeeNumber INT NOT NULL, --员工编号
employeeBirth DATETIME NOT NULL, --出生日期
employeeRetirement AS (DATEADD(YEAR, , (employeeBirth)-())) PERSISTED --退休日期
)

此时我们看到表中关于退休日期的设计,显示其已经是持久化了的

接下来我们插入测试数据看看

USE TSQL2012
GO INSERT INTO dbo.Employee( employeeNumber, employeeBirth )
SELECT ,'1985-12-13' UNION ALL
SELECT ,'1989-11-18' UNION ALL
SELECT ,'1990-01-19' UNION ALL
SELECT ,'1993-06-13' UNION ALL
SELECT ,'1995-07-23'

然后我们来查询表

USE TSQL2012
GO SELECT *
FROM dbo.Employee

此时我们通过查询雇员表得到其每个雇员的退休日期,到这里是没什么问题的,既然我们设置它是持久化的,也就说当其他列发生改变时计算列也会对应发生改变,突然有一天编号为305423的雇员和录入信息的同事交流,他其实是1986年出生的,上面的1985年是身份证上的,身份证搞错了,此时我们需要更新其出生日期到1986年,如下

UPDATE dbo.Employee SET employeeBirth = '1986-12-13' WHERE employeeNumber = ''

接下来我们再来查询数据看看。

此时我们发现当出生日期发生修改时,其对应的计算列也进行了同步由原来的2045更新到了2046,上述我们添加在计算列中添加了Persisted关键字,是不是因为添加这个关键字导致持久化从而当一个列进行更新时,计算列也就同步更新了呢,难道这就是Persisted持久化的作用吗,实际情况不是这样的,当你去掉Persisted关键字此时也会进行同步更新(不信你可以试试),那么Persisted关键字的作用是什么呢?事实情况是这样的,当我们在列上创建了计算列时,此时计算出来的数据并没有存在列中(至于存在哪里我也不知道),计算的数据是在运行时计算出来的,当用Persisted关键字标识计算列之后,这个时候才是将计算结果存在表中计算列上。继续往下看数据存储空间使用情况就可以得到验证。

通过计算列持久化进一步探讨数据存储空间

下面我们来看看当未添加计算列、添加计算列、计算列持久化时表数据存储空间情况。下面我们来创建测试表

USE TSQL2012
GO CREATE TABLE [dbo].[ComputeColumn]
(
ID INT,
FirstName VARCHAR(),
LastName VARCHAR()
)
GO

在表中插入10万条数据

INSERT INTO [ComputeColumn] (ID,FirstName,LastName)
SELECT TOP ROW_NUMBER() OVER (ORDER BY a.name) RowID,
'Bob',
CASE WHEN ROW_NUMBER() OVER (ORDER BY a.name)% = THEN 'Smith'
ELSE 'Brown' END
FROM sys.all_objects a
CROSS JOIN sys.all_objects b
GO

此时我们来看看有关表存储空间使用情况

USE TSQL2012
GO sp_spaceused '[ComputeColumn]'
GO

上述我们得知存储数据为2680KB,下面我们再来创建计算列看看。

ALTER TABLE dbo.[ComputeColumn] ADD
FullName AS (FirstName+' '+LastName)
GO

从这里我们可以得出当创建计算列时其数据根本没有存在列上,我们再来看看添加持久化关键字时情况又是怎样的呢

ALTER TABLE dbo.[ComputeColumn] ADD
FullName_P AS (FirstName+' '+LastName) PERSISTED
GO

当添加持久化关键字时此时表存储数据空间变为了4784KB,到此验证了当未添加Persisted关键字时,在计算列上的数据根本没有存在列上而是在运行时进行了计算,当用Persisted关键字标识计算列时此时数据才存在列上。

通过计算列持久化深入探讨数据存储空间

我们知道如果对列创建索引的话肯定需要一定空间来存储索引,上述我们对列进行了持久化,此时会增加表存储空间,要是我们创建索引是不是会增加表数据存储空间大小呢?我们在未创建计算列前先创建索引看看其表中各种数据空间存储大小,即在创建的列FullName上创建索引。

USE TSQL2012
GO CREATE NONCLUSTERED INDEX idx_comCol_FullName
ON dbo.ComputeColumn (FullName)

因为创建了索引,所以只是导致索引空间变大了,下面我们再创建计算列持久化并看看其表空间使用情况

USE TSQL2012
GO ALTER TABLE dbo.ComputeColumn ADD
FullName_P AS (FirstName+' '+LastName) PERSISTED

从上我们可以看到增加索引未导致表数据大小的增加,而创建计算列持久化则需要额外的空间。分析到这里为止,我们来给出一个基本结论:

计算列分析结论:计算列的用途主要用于多个计算并且比较复杂的计算,如果对计算列进行持久化虽然能够大大减少计算开销但是它会额外增加磁盘空间。

总结

本节我们学习了计算列以及将其持久化的基础内容,下一节我们讲讲关于计算列以及计算列持久化的性能问题,简短的内容,深入的理解,我们下节再会。

SQL Server-聚焦计算列持久化(二十一)的更多相关文章

  1. SQL Server-聚焦计算列或计算列持久化查询性能(二十二)

    前言 上一节我们详细讲解了计算列以及计算列持久化的问题,本节我们依然如前面讲解来看看二者查询性能问题,简短的内容,深入的理解,Always to review the basics. 持久化计算列比非 ...

  2. SQL Server 2008空间数据应用系列二:空间索引(Spatial Index)基础

    原文:SQL Server 2008空间数据应用系列二:空间索引(Spatial Index)基础 在前一篇博文中我们学习到了一些关于地理信息的基础知识,也学习了空间参照系统,既地球椭球体.基准.本初 ...

  3. SQL SERVER FOR 多列字符串连接 XML PATH 及 STUFF

    原文:SQL SERVER FOR 多列字符串连接 XML PATH 及 STUFF 本来用 Writer 写一篇关于一列多行合并的博客来的,结果快写完了时候,在一个插入代码时候,崩了,重新打开,居然 ...

  4. SQL Server 2014 聚集列存储

    SQL Server 自2012以来引入了列存储的概念,至今2016对列存储的支持已经是非常友好了.由于我这边线上环境主要是2014,所以本文是以2014为基础的SQL Server 的列存储的介绍. ...

  5. SQL Server分区键列必须是主键一部分

    SQL Server分区键列必须是主键一部分. 必须把分区列包含在主键/唯一约束/唯一索引的键列中. USE tempdb GO -- 测试表 CREATE TABLE dbo.tb( id int, ...

  6. SQL Server修改标识列方法(备忘)

    原文:SQL Server修改标识列方法(备忘) SQL Server修改标识列方法 ----允许对系统表进行更新 exec sp_configure 'allow updates',1 reconf ...

  7. sql server 自增列,值突然增大1000的情况

    sql server 自增列,值突然增大1000的情况   解决方法: 1 打开配置管理器2左面点击sql服务3右面 右键点击SQL Server(MSSQLSERVER) 4点击 启动参数5 在参数 ...

  8. sql server 某一列求和

    sql server 某一列求和 SELECT 患者来源,设备类型,检查部位,设备名称,convert(char(10),STUDY_DATE,121) as 日期, count(distinct 就 ...

  9. SQL Server 性能优化实战系列(二)

    SQL Server datetime数据类型设计.优化误区 一.场景 在SQL Server 2005中,有一个表TestDatetime,其中Dates这个字段的数据类型是datetime,如果你 ...

随机推荐

  1. CoreCLR源码探索(一) Object是什么

    .Net程序员们每天都在和Object在打交道 如果你问一个.Net程序员什么是Object,他可能会信誓旦旦的告诉你"Object还不简单吗,就是所有类型的基类" 这个答案是对的 ...

  2. [原创]mybatis中整合ehcache缓存框架的使用

    mybatis整合ehcache缓存框架的使用 mybaits的二级缓存是mapper范围级别,除了在SqlMapConfig.xml设置二级缓存的总开关,还要在具体的mapper.xml中开启二级缓 ...

  3. Jquery mobiscroll 移动设备(手机)wap日期时间选择插件以及滑动、滚动插件

    Jquery Mobiscroll是一个用于触摸设备(Android phones, iPhone, iPad, Galaxy Tab)的日期和时间选择器jQuery插件.以及各种滑动插件 可以让用户 ...

  4. 开始学nodejs——net模块

    net模块的组成部分 详见 http://nodejs.cn/api/net.html 下面整理出了整个net模块的知识结构,和各个事件.方法.属性的用法 net.Server类 net.Socket ...

  5. 【转】java通用URL接口地址调用方式GET和POST方式

    java通用URL接口地址调用方式GET和POST方式,包括建立请求和设置请求头部信息等等......... import java.io.ByteArrayOutputStream; import ...

  6. Javascript高性能编程-提高Dom访问速度

    在浏览器中对于Dom的操作和普通的脚本的操作处于两个不同的dll中,两个dll的交互是比较耗时的,优化对Dom的操作可以提高脚本的执行速度.下面是对如何优化的一些总结: 将需要多次操作的节点存储在一个 ...

  7. BPM公文管理解决方案分享

    一.方案概述 公文作为一种规范性文书,具有法律性.指导性.政令性强的特点,是企事业单位政令上通下达的重要方式.及时.准确.安全地处理.控制和管理公文,方能保障企事业单位正常运转,确保组织权威和政令畅通 ...

  8. Android中Fragment和ViewPager那点事儿(仿微信APP)

    在之前的博文<Android中使用ViewPager实现屏幕页面切换和引导页效果实现>和<Android中Fragment的两种创建方式>以及<Android中Fragm ...

  9. Linux根文件系统分析之init和busybox

    Hi,大家好!我是CrazyCatJack.今天给大家讲解Linux根文件系统的init进程和busybox的配置及编译. 先简单介绍一下,作为一个嵌入式系统,要想在硬件上正常使用的话.它的软件组成大 ...

  10. 将MPM雪模拟移植到Maya

    同事实现了一个迪士尼的MPM雪模拟论文,我将其移植到Maya中 论文题目是 A material point method for snow simulation 代码在这里: https://git ...