SQL Server OPTION (OPTIMIZE FOR UNKNOWN) 测试总结

关于SQL Server的查询提示OPTION (OPTIMIZE FOR UNKNOWN) ，它是解决参数嗅探的方法之一。而且对应的SQL语句会缓存，不用每次都重编译。关键在于它的执行计划的准确度问题，最近在优化的时候，和同事对于这个查询提示（Query Hint）有一点分歧，遂动手实验验证、总结了一些东西。

关于提示OPTION (OPTIMIZE FOR UNKNOWN)，它会利用统计数据和标准算法生成一个折中、稳定的执行计划，但是它是无法利用直方图（histogram）信息来生成执行计划。官方文档的介绍如下：

OPTIMIZE FOR 编译和优化查询时提示查询优化器对本地变量使用特定值。仅在查询优化期间使用该值，在查询执行期间不使用该值。

UNKNOWN

指定查询优化器在查询优化期间使用统计数据而不是初始值来确定局部变量的值。OPTIMIZE FOR 可以抵消优化器的默认参数检测行为，也可在创建计划指南时使用

OPTIMIZE FOR UNKNOWN

指示查询优化器在查询已经过编译和优化时为所有局部变量使用统计数据而不是初始值，包括使用强制参数化创建的参数。有关强制参数化的详细信息，请参阅强制参数化。

如果在同一查询提示中使用 OPTIMIZE FOR @variable\_name = literal_constant 和 OPTIMIZE FOR UNKNOWN，则查询优化器将对特定的值使用指定的 literal_constant，而对其余变量使用 UNKNOWN。这些值仅用于查询优化期间，而不会用于查询执行期间。

OPTIMIZE FOR UNKNOWN是否会用直方图数据呢？不会，OPTIMIZE FOR UNKNOWN只会用简单的统计数据。我们以how-optimize-for-unknown-works这篇博客中的例子来演示一下，下面测试环境为SQL Server 2014，数据库为AdventureWorks2014

CREATE PROCEDURE test (@pid int)

AS

SELECT * FROM [Sales].[SalesOrderDetail]

WHERE ProductID = @pid OPTION (OPTIMIZE FOR UNKNOWN);

为了消除统计信息不准确会干扰测试结果，我们手工更新一下统计信息。

UPDATE STATISTICS [Sales].[SalesOrderDetail] WITH FULLSCAN;

我们在SSMS里面点击“包含实际执行计划”选项，然后测试执行该存储过程，如下截图所示：执行计划居然走聚集索引扫描

EXEC test @pid=709

Filter里面过滤的记录为456.079，而实际上ProductID=709的记录有188条，那么优化器是怎么估计判断记录数为456.709的呢？

其实优化器是这样来估计的：它使用ProductID列的密度(Density)* Rows来计算的

SELECT 0.003759399 *121317 ~= 456.079008483 ~= 456.079

而ProductID列的密度(Density)的计算是这样来的:

ProductID的值有266个，可以用下面SQL获取ProductID的值个数

SELECT COUNT(DISTINCT ProductID) FROM Sales.SalesOrderDetail

SELECT 1.0/266 ~= 0.003759

然后你可以使用任意不同的参数测试，例如707、712......, 你会发现使用查询提示OPTION (OPTIMIZE FOR UNKNOWN)后，优化器会总是使用相同的执行计划。也就是说这个查询提示生成的执行计划是一个“折中的执行计划” ，对于数据分布倾斜的比较厉害（数据分布极度不均衡）的情况下，是极度不建议使用查询提示OPTION (OPTIMIZE FOR UNKNOWN)的。

本人曾经一度对使用OPTION（RECOMPILE）还是OPTION (OPTIMIZE FOR UNKNOWN)感到困惑和极度难以取舍，后面总结了一下：

1：执行不频繁的存储过程，使用OPTION（RECOMPILE）要优先与OPTION (OPTIMIZE FOR UNKNOWN)

2：执行频繁的存储过程，使用OPTION (OPTIMIZE FOR UNKNOWN)要优先于OPTION（RECOMPILE）

3：数据分布倾斜的厉害的情况下，优先使用OPTION（RECOMPILE）

4: 使用OPTION (OPTIMIZE FOR UNKNOWN)会生成一个稳定、统一的执行计划，如果这个执行计划的效率基本能满足用户需求，那么优先使用OPTION (OPTIMIZE FOR UNKNOWN)

参考资料：

https://docs.microsoft.com/zh-cn/previous-versions/sql/sql-server-2008/ms181714(v=sql.100)

http://www.benjaminnevarez.com/2010/06/how-optimize-for-unknown-works/

https://blogs.msdn.microsoft.com/sqlprogrammability/2008/11/26/optimize-for-unknown-a-little-known-sql-server-2008-feature/

SQL Server OPTION (OPTIMIZE FOR UNKNOWN) 测试总结的更多相关文章

Top 10 steps to optimize data access in SQL Server
2009年04月28日 Top 10 steps to optimize data access in SQL Server: Part I (use indexing) 2009年06月01日 To ...
.Net EF Core数据库使用SQL server 2008 R2分页报错How to avoid the “Incorrect syntax near 'OFFSET'. Invalid usage of the option NEXT in the FETCH statement.”
一. 问题说明最近.Net EF core 程序部署到服务器,服务器数据库安装的是SQL server 2008 R2,我本地用的的是SQL server 2014,在用到分页查询时报错如下: H ...
.NET Core EF框架使用SQL server 2008数据库分页问题：Incorrect syntax near 'OFFSET'. Invalid usage of the option NEXT in the FETCH statement
一. 问题最近.Net Core程序部署到服务器,采用EF6.本地数据库是SQL server 2016,服务器数据库安装的是SQL server 2008 R2,在用到分页查询时报错如下: { & ...
谈一谈SQL Server中的执行计划缓存（下）
简介在上篇文章中我们谈到了查询优化器和执行计划缓存的关系,以及其二者之间的冲突.本篇文章中,我们会主要阐述执行计划缓存常见的问题以及一些解决办法. 将执行缓存考虑在内时的流程上篇文章中提到了查询优 ...
SQL SERVER 中的提示
提示是指定的强制选项或策略,由 SQL Server 查询处理器针对 SELECT.INSERT.UPDATE 或 DELETE 语句执行. 提示将覆盖查询优化器可能为查询选择的任何执行计划. 注意: ...
（转）SQL Server 性能调优（cpu）
摘自:http://www.cnblogs.com/Amaranthus/archive/2012/03/07/2383551.html 研究cpu压力工具 perfom SQL跟踪性能视图 cpu ...
SQL Server 2016的数据库范围内的配置
SQL Server 2016真的让人眼前一亮.几天前微软就提供了RCO(候选发布版)版本的下载.我已经围观了一圈RCO版本,其中一个最拽的功能是数据库范围内的配置(Database Scoped C ...
《Troubleshooting SQL Server》读书笔记-CPU使用率过高（下）
<Troubleshooting SQL Server>读书笔记-CPU使用率过高(下) 第三章 High CPU Utilization. CPU使用率过高的常见原因查询优化器会尽量从 ...
Microsoft SQL Server Trace Flags
Complete list of Microsoft SQL Server trace flags (585 trace flags) REMEMBER: Be extremely careful w ...

随机推荐

通过appium-desktop定位元素
https://www.cnblogs.com/feng0815/p/8481679.html http://www.cnblogs.com/feng0815/p/8481495.html appiu ...
Android--多线程之进程与线程
前言对于Android程序中,使用多线程的技术是必不可少的,就拿之前最简单的例子来说明,对于Android4.0+的应用而言,访问网络必须另起线程才可以访问.本片博客介绍Android下进程和线程, ...
Maven内置属性、POM属性
1.内置属性(Maven预定义,用户可以直接使用) ${basedir}表示项目根目录,即包含pom.xml文件的目录; ${version}表示项目版本; ${project.basedir}同${ ...
SpringCloud实战9-Stream消息驱动
官方定义 Spring Cloud Stream 是一个构建消息驱动微服务的框架. 应用程序通过 inputs 或者 outputs 来与 Spring Cloud Stream 中binder 交互 ...
python练习四—简单的聊天软件
python最强大的是什么?库支持!!有了强大的库支持,一个简单的聊天软件实现就更简单了,本项目思路如下 # 项目思路 1. 服务器的工作 * 初始化服务器 * 新建一个聊天房间 * 维护一个已链接用 ...
priority_queue的用法
priority_queue本质是一个堆. 1. 头文件是#include<queue> 2. 关于priority_queue中元素的比较模板申明带3个参数:priority_queu ...
Java并发编程-AbstractQueuedSynchronizer源码分析
简介提供了一个基于FIFO队列,可以用于构建锁或者其他相关同步装置的基础框架.该同步器(以下简称同步器)利用了一个int来表示状态,期望它能够成为实现大部分同步需求的基础.使用的方法是继承,子类通过 ...
mysql年初至今聚合
年初至今聚合和滑动聚合类似,不同的地方仅在于统计的仅为当前一年的聚合.唯一的区别体现在下限的开始位置上.在年初至今的问题中,下限为该年的第一天,而滑动聚合的下限为N个月的第一天.因此,年初至今的问题的 ...
python 时间模块time，datetime
模块(module)是 Python 中非常重要的东西,你可以把它理解为 Python 的扩展工具.换言之,Python 默认情况下提供了一些可用的东西,但是这些默认情况下提供的还远远不能满足编程实践 ...
Go基础系列：读取标准输入
fmt包中提供了3类读取输入的函数: Scan家族:从标准输入os.Stdin中读取数据,包括Scan().Scanf().Scanln() SScan家族:从字符串中读取数据,包括Sscan().S ...

SQL Server OPTION (OPTIMIZE FOR UNKNOWN) 测试总结

SQL Server OPTION (OPTIMIZE FOR UNKNOWN) 测试总结的更多相关文章

随机推荐

热门专题