SQL瓶颈分析，以及适应最佳执行计划的探讨

原文地址： https://blog.csdn.net/daiqiulong2/article/details/86546446?tdsourcetag=s_pcqq_aiomsg

年纪大了，慢慢的写技术文档也不皮了。一五一十的说说清楚，问题是什么，解决方案又是什么。中规中矩的写。

SQL_ID: 1m6akd1s2144u, 执行成本： 40万次/h 3000逻辑读/次。

TOP10SQL的问题类似，现在分析优化d4wcdsskp0f47

d4wcdsskp0f47 SQL和这个SQL类似。

SELECT * FROM (SELECT XX.*, ROWNUM AS RN FROM (select count(*) from CUST_YC_APP.PARTY_CERT P inner join CUST_YC_APP.CUSTOMER C on P.PARTY_ID = C.PARTY_ID and C.STATUS_CD = '1100' where P.PARTY_ID in (:1 ) and P.STATUS_CD in (:2 ) and P.IS_DEFAULT = '1') XX WHERE ROWNUM <= 1000 ) XXX WHERE RN > 0

执行计划：

执行计划中有笛卡尔积，但是问题并不在笛卡尔积中。（好多DBA看到笛卡尔集就说笛卡尔集有性能问题，其实是不严谨的，的确很多笛卡尔集是有性能问题，但是此处不是最主要的问题）

查询中绑定变量的值如：B1:15151722241919 B2: ‘1000’

带入到SQL中查询只9逻辑读。

查询性能瓶颈：

通过采样分析，更多的性能消耗在执行计划的第9步。也就在C表(CUSTOMER)的回表上。

SQL中得出C表用到两个字段 C.PARTY_ID,C.STATUS_CD。 PARTY_ID上建有索引，回表就是为了访问STATUS_CD字段。

因此建议建立索引index C ( PARTY_ID, STATUS_CD ); 这样可以避免回表。

针对该SQL 优化建议建立索引，即可。

猜测根本原因：

是否是部分由于C表 PARTY_ID某些特定值过多，造成大量会表。

查询表中的数据分布以及绑定变量中的值。

查询数据分布：C表 PARTY_ID字段的选择性 98%，但是有个值，重复率非常高。

查询数据分布以及关联绑定变量。

(这个SQL只表示这些值在绑定变量中出现过，但是出现的频率未知。。。。但能说明问题)

这个SQL表明，部分不均匀的

果然当PARTY_ID = 15151723602037，回表需要回10万次。

用auto trace 中单次执行需要消耗逻辑读7770。针对该问题已经有相关建议。

下文是探讨针对该表数据分布以及SQL 如何进一步优化。

既然数据分布不均衡，是否可以通过收集直方图来改善性能？答案是否定的。

建立测试表： CUSTOMER_test

create table CUSTOMER_test tablespace TBS_CUST_DATA as

select * from CUST_YC_APP.CUSTOMER C ;

create index idx_pid on CUSTOMER_test(PARTY_ID);

收集直方图：

begin

DBMS_STATS.GATHER_TABLE_STATS(OWNNAME => 'CHECKDB',

TABNAME => 'CUSTOMER_TEST',

ESTIMATE_PERCENT => 50,

METHOD_OPT => 'for columns PARTY_ID size skewonly',

DEGREE => 2,

GRANULARITY => 'ALL',

CASCADE => TRUE);

END;

执行SQL：SQL效率更差。 15万逻辑读/次

回到SQl中。关键部分：

需要确认是否可以改成半连接， ( 业务那边是要确认是否可以等价改写，此处讨论这种数据分布情况下如何实施优化 )

因为针对数据分布不均衡半连接效果比较好。

改写SQL：

SELECT *

FROM (SELECT XX.*, ROWNUM AS RN

FROM (select count(1)

from CUST_YC_APP.PARTY_CERT P

where P.PARTY_ID in (15151723602037)

and P.PARTY_ID in ( select /*+ nl_sj index(c) */ C.PARTY_ID from checkdb.CUSTOMER_test C where C.STATUS_CD = '1100' )

and P.STATUS_CD in ('1000')

and P.IS_DEFAULT = '1') XX

WHERE ROWNUM <= 1000) XXX

WHERE RN > 0;

9 逻辑读/次. （不添加hints 就会走全表，成本1286次/S ）

不添加hints 就会走全表，成本1286次/S

SQL无法自动走用好的执行计划，需要绑定hints才走。如何自动走好的执行计划？？

答案

1 删除直方图。

2设置数据选择性，综合比较选择性设置成 30% 比较好。

（选择性设置成30，只要数据总量 * 30% 即可）

删除直方图, 设置选择性。

begin

dbms_stats.delete_column_stats(OWNNAME => 'CHECKDB',

TABNAME => 'CUSTOMER_TEST',

colname =>'PARTY_ID',

col_stat_type=>'HISTOGRAM' );

end;

begin

DBMS_STATS.set_column_stats(OWNNAME => 'CHECKDB',

TABNAME => 'CUSTOMER_TEST',

colname =>'PARTY_ID',distcnt => 1645919);

end;

这次测试不添加hints的情况下，是否能走最好的执行计划。

果然走nested_loop 半连接并且走 C（PARTY_ID）索引（图就不贴了）。9逻辑读

另外也测试了SQL

select count(1)

from CHECKDB.CUSTOMER_TEST t

where PARTY_ID = 15151723602037 and t.status_cd in ('1100');

收集直方图：走全表扫描 156935逻辑读/次

删除直方图：走索引扫描 7903逻辑读/次

至于什么情况下收集直方图，删除直方图，收集统计信息。这个不多说了。看我之前博客设置统计信息优化SQL的案例。
---------------------
作者：越烟
来源：CSDN
原文：https://blog.csdn.net/daiqiulong2/article/details/86546446
版权声明：本文为博主原创文章，转载请附上博文链接！

SQL瓶颈分析，以及适应最佳执行计划的探讨的更多相关文章

浅析SqlServer简单参数化模式下对sql语句自动参数化处理以及执行计划重用
我们知道,SqlServer执行sql语句的时候,有一步是对sql进行编译以生成执行计划, 在生成执行计划之前会去缓存中查找执行计划如果执行计划缓存中有对应的执行计划缓存,那么SqlServer就会 ...
SQL Server INSET/UPDATE/DELETE的执行计划
DML操作符包括增删改查等操作方式. insert into Person.Address (AddressLine1, AddressLine2, City, StateProvinceID, Po ...
SQL Server 性能调优之执行计划（Execution Plan）调优
SQL Server 存在三种 Join 策略:Hash Join,Merge Join,Nested Loop Join. Hash Join:用来处理没有排过序/没有索引的数据,它在内存中把 Jo ...
SQL Server如何查看存储过程的执行计划
有时候,我们需要查看存储过程的执行计划,那么我们有什么方式获取存储过程的历史执行计划或当前的执行计划呢? 下面总结一下获取存储过程的执行计划的方法. 1:我们可以通过下面脚本查看存储过程的执行计划,但 ...
不会看 Explain执行计划，劝你简历别写熟悉 SQL优化
昨天中午在食堂,和部门的技术大牛们坐在一桌吃饭,作为一个卑微技术渣仔默默的吃着饭,听大佬们高谈阔论,研究各种高端技术,我TM也想说话可实在插不上嘴. 聊着聊着突然说到他上午面试了一个工作6年的程序员, ...
使用Oracle执行计划分析SQL性能
执行计划:一条查询语句在ORACLE中的执行过程或访问路径的描述.即就是对一个查询任务,做出一份怎样去完成任务的详细方案. 如果要分析某条SQL的性能问题,通常我们要先看SQL的执行计划,看看SQL的 ...
SQL Server 执行计划分析
当一个查询到达数据库引擎时,SQL Server执行两个主要的步骤来产生期望的查询结果: 第一步:查询编译,生成查询计划. 第二步:执行这个查询计划. 1. 用于演示分析执行计划的查询语句 /* 查询 ...
SELECT TOP 1 比不加TOP 1 慢的原因分析以及SELECT TOP 1语句执行计划预估原理
本文出处:http://www.cnblogs.com/wy123/p/6082338.html 现实中遇到过到这么一种情况: 在某些特殊场景下:进行查询的时候,加了TOP 1比不加TOP 1要慢(而 ...
SQL Server 执行计划缓存
标签:SQL SERVER/MSSQL SERVER/数据库/DBA/内存池/缓冲区概述了解执行计划对数据库性能分析很重要,其中涉及到了语句性能分析与存储,这也是写这篇文章的目的,在了解执行计划之 ...

随机推荐

探索Windows命令行系列(4)：通过命令操作文件和文件夹
1.文件夹操作 1.1.DIR(directory)命令 1.2.TREE 命令 1.3.CD(change directory)命令 1.4.MD(make directory)命令 1.5.RD( ...
ES6躬行记（14）——函数
在前面的章节中,已陆陆续续介绍了ES6为改良函数而引入的几个新特性,本章将会继续讲解ES6对函数的其余改进,包括默认参数.元属性.块级函数和箭头函数等. 一.默认参数在ES5时代,只能在函数体中定义 ...
springmvc 项目完整示例03 小结
利用spring 创建一个web项目大致原理利用spring的ioc 原理,例子中也就是体现在了配置文件中设置了自动扫描注解配置了数据库信息等一般一个项目,主要有domain,dao,ser ...
Jenkins结合.net平台综合之完整示例项目
前面每一个部分我们都是介绍的单个功能,这里介绍一个完整项目,本文中所用到的命令都放在了github示例代码仓库中 https://github.com/mrtylerzhou/netdevops 命令 ...
NLP入门（六）pyltp的介绍与使用
pyltp的简介语言技术平台(LTP)经过哈工大社会计算与信息检索研究中心 11 年的持续研发和推广, 是国内外最具影响力的中文处理基础平台.它提供的功能包括中文分词.词性标注.命名实体识别.依 ...
第34章授予类型 - Identity Server 4 中文文档(v1.0.0)
授权类型是指定客户端如何与IdentityServer交互的方式.OpenID Connect和OAuth2.0规范定义了以下授权类型: Implicit Authorization code Hyb ...
【Config】类库读取自己的配置文件，配置文件的扩展
我们在项目中一般都是使用统一的项目文件配置,所有的配置和自定义的字段都写在一个web.config或者App.config文件中.一般平时我们也没有发现问题,确实这么写没有问题,但是就是如果写的多了就 ...
C# 在PPT幻灯片中创建图表
图表能够很直观的表现数据在某个时间段的变化趋势,或者呈现数据的整体和局部之间的相互关系,相较于大篇幅的文本数据,图表更增加了我们分析数据时选择的多样性,是我们挖掘数据背后潜在价值的一种更为有效地方式. ...
JavaScript_01简介,基本语法,运算符
JavaScript(不是JScript和scriptease) 1.js分为内部引用和外部引用,无论是内部引用还是外部引用,都可以放在html(除标签内)的任意位置,但是定义的位置会影响执行的顺序 ...
使用Jenkins自动发布Windows服务项目
不同于发布Web项目,自动发布Windows服务项目需要解决以下几个问题: 如何远程停止和开启服务?需要在发布前停止服务,在发布完成后开启服务. 如何上传编译文件到目标服务器? 问题1:如何远程停止和 ...

SQL瓶颈分析，以及适应最佳执行计划的探讨

SQL瓶颈分析，以及适应最佳执行计划的探讨的更多相关文章

随机推荐

热门专题