sqlserver 调优（二）

良好的系统和数据库设计，优质的SQL编写，合适的数据表索引设计，甚至各种硬件因素：网络性能、服务器的性能、操作系统的性能，甚至网卡、交换机等。这篇文章主要讲到如何改善SQL语句，还将有另一篇讨论如何改善索引。
如何改善SQL语句的一些原则：

1. 按需索取字段，跟“SELECT *”说拜拜
字段的提取一定要按照“用多少提多少”的原则，避免使用“SELECT *”这样的操作。做了这样一个实验，表tblA有1000万数据：

select top 10000 c1, c2, c3, c4 from tblA order by c1 desc --用时：4673毫秒
select top 10000 c1, c2, c3 from tblA order by c1 desc --用时：1376毫秒
select top 10000 c1, c2 from tblA order by c1 desc --用时：80毫秒

由此看来，我们每少提取一个字段，数据的提取速度就会有相应的提升。但提升的速度还要看您舍弃的字段的大小来判断。
另外，关于“SELECT *“的问题，可以参考这篇文章：
http://www.cnblogs.com:80/goodspeed/archive/2007/07/20/index_coverage.html

2. 字段名和表名要写规范，注意大小写
这一点要多注意，如果大小写写错的话，虽然SQL仍然能正常执行，但数据库系统会花一定的开销和时间先要把您写的规范成正确的，然后再执行SQL。写对的话，这个时间就省了。
正常的： select top 10 dteTransaction, txtSystem_id from tblTransactionSystem
不小心的：select top 10 dtetransaction, txtsystem_id from tbltransactionsystem

3. 适当使用过渡表
把表的一个子集进行排序并创建临时表，有时能加速查询。它有助于避免多重排序操作，而且在其他方面还能简化优化器的工作。例如：

SELECT cust.name，rcvbles.balance，……other   columns
FROM cust，rcvbles
WHERE cust.customer_id = rcvlbes.customer_id
AND rcvblls.balance>0
AND cust.postcode>“98000”
ORDER BY cust.name

如果这个查询要被执行多次而不止一次，可以把所有未付款的客户找出来放在一个临时文件中，并按客户的名字进行排序：

SELECT cust.name，rcvbles.balance，……other   columns
INTO temp_cust_with_balance
FROM cust，rcvbles
WHERE cust.customer_id = rcvlbes.customer_id
AND rcvblls.balance>0
ORDER BY cust.name

然后以下面的方式在临时表中查询：

SELECT cl,c2 FROM temp_cust_with_balance WHERE postcode>“98000”

临时表中的行要比主表中的行少，而且物理顺序就是所要求的顺序，减少了磁盘I/O，所以查询工作量可以得到大幅减少。注意：过渡临时表创建后不会反映主表的修改。在主表中数据频繁修改的情况下，注意不要丢失数据。

4. 别在where条件中做函数计算
这样做的后果是将在每个行上进行运算，这将导致该列的索引失效而触发全表扫描。如下SQL：

select * from users where YEAR(dteCreated) < 2007

可以改成

select * from users where dteCreated <‘2007-01-01’

这样会使用针对dteCreated的索引，提高查询效率。

5. IN（NOT IN）操作符与EXISTS（NOT EXISTS）操作符
有时候会将一列和一系列值相比较。最简单的办法就是在where子句中使用子查询。在where子句中可以使用两种方式的子查询。如下：
第一种方式使用IN操作符：

select a.id from tblA a where a.id in (select b.id from tblB b)

第二种方式使用EXIST操作符：

select a.id from tblA a where exists (select 1 from tblB b where b.id = a.id)

用IN写出来的SQL的优点是比较容易写及清晰易懂，这比较适合现代软件开发的风格。但是用IN的SQL性能总是比较低的，而第二种格式要远比第一种格式的效率高。从SQL执行的步骤来分析用IN的SQL与不用IN的SQL有以下区别：
SQL试图将其转换成多个表的连接，如果转换不成功则先执行IN里面的子查询，再查询外层的表记录，如果转换成功则直接采用多个表的连接方式查询。由此可见用IN的SQL至少多了一个转换的过程。一般的SQL都可以转换成功，但对于含有分组统计等方面的SQL就不能转换了。
第二种格式中，子查询以’select 1’开始。运用EXISTS子句不管子查询从表中抽取什么数据它只查看where子句。这样优化器就不必遍历整个表而仅根据索引就可完成工作（这里假定在where语句中使用的列存在索引）。相对于IN子句来说，EXISTS使用相连子查询，构造起来要比IN子查询困难一些。
通过使用EXIST，数据库系统会首先检查主查询，然后运行子查询直到它找到第一个匹配项，这就节省了时间。数据库系统在执行IN子查询时，首先执行子查询，并将获得的结果列表存放在一个加了索引的临时表中。在执行子查询之前，系统先将主查询挂起，待子查询执行完毕，存放在临时表中以后再执行主查询。这也就是使用EXISTS比使用IN通常查询速度快的原因。
同时应尽可能使用NOT EXISTS来代替NOT IN，尽管二者都使用了NOT（不能使用索引而降低速度），NOT EXISTS要比NOT IN查询效率更高。

6. IS NULL 或 IS NOT NULL操作（判断字段是否为空）
不能用null作索引，任何包含null值的列都将不会被包含在索引中，因为B树索引是不索引空值的。即使索引有多列这样的情况下，只要这些列中有一列含有null，该列就会从索引中排除。也就是说如果某列存在空值，即使对该列建索引也不会提高性能。
任何在where子句中使用is null或is not null的语句优化器是不允许使用索引的。
推荐方案：用其它相同功能的操作运算代替，如a is not null 改为 a>0 或a>’等。另外还设置字段不允许为空，而用一个缺省值代替空值，如一个datetime字段，可以将默认时间设为“1900-01-01”。

7. > 及 < 操作符（大于或小于操作符）
大于或小于操作符一般情况下是不用调整的，因为它有索引就会采用索引查找，但有的情况下可以对它进行优化，如一个表有100万记录，一个数值型字段A，30 万记录的A=0，30万记录的A=1，39万记录的A=2，1万记录的A=3。那么执行A>2与A>=3的效果就有很大的区别了，因为 A>2时sql会先找出为2的记录索引再进行比较，而A>=3时sql则直接找到=3的记录索引。可结合非聚集索引一起考虑。

8. LIKE操作符
LIKE 操作符可以应用通配符查询，里面的通配符组合可能达到几乎是任意的查询，但是如果用得不好则会产生性能上的问题，如LIKE ‘%5400%’ 这种查询不会引用索引，而LIKE ‘X5400%’则会引用范围索引。因为索引的摆放是依据字段值升序或降序排列，like'%*'这种用法，不能利用有序的数据结构，利用二分法查找数据。一个实际例子：用YW_YHJBQK表中营业编号后面的户标识号可来查询营业编号 YY_BH LIKE ‘%5400%’ 这个条件会产生全表扫描，如果改成YY_BH LIKE ’X5400%’ OR YY_BH LIKE ’B5400%’ 则会利用YY_BH的索引进行两个范围的查询，性能肯定大大提高。

9. 查询条件中的适当与不适当
查询参数可以包含一下操作：=、<、>、>=、<=、BETWEEN、部分like。其中，like当这样使用时会用到索引：like '*%',但like'%*'就用不到索引。
不适当的查询参数有：NOT 、!= 、<>、 !>、 !< 、NOT EXISTS、 NOT IN 、NOT LIKE等，还有一些不当的用法，例如：对数据进行计算，负向查询、等号左边使用函数、使用OR。上述语法都不用不上索引，降低程序的效率。

10. 慎用DELETE

一般在存储过程中或多或少都会实现一些删除数据的逻辑。对小数量的表来说，问题倒是不大。但对于大数据量的表来说，采用delete删除数据会对储存过程的性能产生一定的影响。因为delete采用的是全表逐条扫描的方式进行，是一种事务性操作，会计入SQL Server的事务日志中。不但增加了运行时间，同时也频繁写入LOG文件，导致LOG文件过大，过分消耗磁盘空间。所以，可以用truncate操作代替delete，truncate并不会计入事务日志中，同时也是不带条件的删除，执行速度很快。又或者直接drop掉表重新创建，有时都会比delete来得快。

PS: 第10点引出的两种清空SQL Server日志文件的方法

一种方法：清空日志。

1．打开查询分析器，输入命令DUMP TRANSACTION 数据库名 WITH NO_LOG

2.再打开企业管理器--右键你要压缩的数据库--所有任务--收缩数据库--收缩文件--选择日志文件--在收缩方式里选择收缩至XXM,这里会给出一个允许收缩到的最小M数,直接输入这个数,确定就可以了。

另一种方法有一定的风险性，因为SQL SERVER的日志文件不是即时写入数据库主文件的，如处理不当，会造成数据的损失。

1: 删除LOG

分离数据库企业管理器－＞服务器－＞数据库－＞右键－＞分离数据库

2：删除LOG文件

附加数据库企业管理器－＞服务器－＞数据库－＞右键－＞附加数据库

此法生成新的LOG，大小只有500多K。

sqlserver 调优（二）的更多相关文章

【机器学习基础】SVM实现分类识别及参数调优(二)
前言实现分类可以使用SVM方法,但是需要人工调参,具体过程请参考here,这个比较麻烦,小鹅不喜欢麻烦,正好看到SVM可以自动调优,甚好! 注意 1.reshape的使用: https://docs ...
sqlserver 调优（三）
用户数据库质疑状态处理(可能由于机房断电,数据库服务器异常重启后,导致个别数据库状态质疑): --修复数据库(置疑) -- xxxDB 为需要修复的数据库的名称 ALTER DATABASE xxxD ...
JVM基础和调优(二)
主要讲述java虚拟机的内存体系结构了解了JVM 的一些基础之后,我们来看看java虚拟机内存的体系结构,这个是理解JVM垃圾收集算法的前提,理解了内存结构我们才能够针对不同的部分根据我们的程序进行 ...
Twitter 工程师谈 JVM 调优
一. 调优需要关注的几个方面内存调优 CPU 使用调优锁竞争调优 I/O 调优二. Twitter 最大的敌人:延迟导致延迟的几个原因? 最大影响因素是 GC 其他的有:锁和线程调度.I/O. ...
MGR架构~ 整体性能架构的调优
一简介:MGR集群架构的调优二过程:本文将从各个角度来具体阐述下三硬件 1 硬件选择相同配置的服务器,磁盘,内存,cpu性能越高越好四网络 1 0丢包和最好万兆网卡五 MGR本身 ...
sql server调优
SQLServer调优:查询语句运行几个指标值监测\ https://www.cnblogs.com/zhijianliutang/p/4179110.html
spark调优——JVM调优
对于JVM调优,首先应该明确,(major)full gc/minor gc,都会导致JVM的工作线程停止工作,即stop the world. JVM调优一:降低cache操作的内存占比 1. ...
spark调优——Shuffle调优
在Spark任务运行过程中,如果shuffle的map端处理的数据量比较大,但是map端缓冲的大小是固定的,可能会出现map端缓冲数据频繁spill溢写到磁盘文件中的情况,使得性能非常低下,通过调节m ...
spark调优——算子调优
算子调优一:mapPartitions 普通的map算子对RDD中的每一个元素进行操作,而mapPartitions算子对RDD中每一个分区进行操作.如果是普通的map算子,假设一个partition ...

随机推荐

Openstack组件实现原理 — Nova 体系结构
目录目录前文列表 Nova体系结构虚拟机实例化流程前文列表 Openstack组件部署 - Overview和前期环境准备 Openstack组建部署 - Environment of Con ...
MarkDown 快速开始上手
*:first-child { margin-top: 0 !important; } body>*:last-child { margin-bottom: 0 !important; } /* ...
java.lang.Boolean.compareTo()方法实例
compareTo接口 Comparable<Boolean>指定以下接口参数 b - 布尔实例进行比较返回值方法返回 0 - 如果该对象表示相同的布尔值作为参数一个正数值 - 如 ...
VC++ 2010 创建高级Ribbon界面详解(1)
运用 VC++ 2010 创建高级 Ribbon 界面详解,包括 Ribbon 界面的结构层次.Ribbon 控件的使用等,ribbon 用户界面,ribbon interface ,ribbon 高 ...
JUC源码分析-线程池篇（三）Timer
JUC源码分析-线程池篇(三)Timer Timer 是 java.util 包提供的一个定时任务调度器,在主线程之外起一个单独的线程执行指定的计划任务,可以指定执行一次或者反复执行多次. 1. Ti ...
EM相关两个算法 k-mean算法和混合高斯模型
转自http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006924.html http://www.cnblogs.com/jerrylead/ ...
async / await对异步的处理
虽然co是社区里面的优秀异步解决方案,但是并不是语言标准,只是一个过渡方案.ES7语言层面提供async / await去解决语言层面的难题.目前async / await 在 IE edge中已经可 ...
XML中的值得注意的"坑"
XML严禁 & < ,建议 < > & ' "进行转义 XML中预定义了5个实体引用: < > & ' " 其中,'<' ...
SQL Injection简介
js排他功能示例
<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8" ...

sqlserver 调优（二）

sqlserver 调优（二）的更多相关文章

随机推荐

热门专题