不当使用 union all 导致的SQL解析时间过长的问题优化

在帮助用户优化应用过程中，发现用户大量使用union all 导致SQL解析非常缓慢的问题。考虑到这个问题很有代表意义，我觉得很有必要对于问题进行总结。

一、用户例子

WITH company_user_temp AS (SELECT '00629999000100260000' AS company_code

 FROM dual

 UNION ALL

 SELECT '00250033000000000000' AS company_code FROM dual

 UNION ALL

 SELECT '00630005000300000000' AS company_code FROM dual

 UNION ALL

 SELECT '00460207000000000000' AS company_code FROM dual

 UNION ALL

 SELECT '00420089000000000000' AS company_code FROM dual

 UNION ALL

 SELECT '00630008000100000000' AS company_code FROM dual

 UNION ALL

 SELECT '00630013001000000000' AS company_code FROM dual

 UNION ALL

 SELECT '00620035001900000000' AS company_code FROM dual

。。。

用户大量使用值的union all，导致90%的时间耗在SQL解析上。

         ->  Seq Scan on dual dual_1458  (cost=0.00..1.01 rows=1 width=0) (actual time=0.003..0.004 rows=1 loops=1)

         ->  Seq Scan on dual dual_1459  (cost=0.00..1.01 rows=1 width=0) (actual time=0.005..0.005 rows=1 loops=1)

         ->  Seq Scan on dual dual_1460  (cost=0.00..1.01 rows=1 width=0) (actual time=0.003..0.004 rows=1 loops=1)

         ->  Seq Scan on dual dual_1461  (cost=0.00..1.01 rows=1 width=0) (actual time=0.003..0.004 rows=1 loops=1)

 Planning Time: 5081.423 ms

 Execution Time: 43.726 ms

(1466 rows)

Time: 5230.600 ms (00:05.231)

二、问题分析

由于SQL有大量的union all，针对union all 的每个部分，SQL 都要进行解析。由于整个SQL涉及2000多张表（dual），整个性能非常差。考虑以下修改方式：

with company_user_temp as (select  * from (values('00629999000100260000'), ('00250033000000000000')) as company_code )

select count(*) from company_user_temp;

通过这种方式，可以减少整条SQL涉及表的数量，提升SQL解析的性能。

三、验证分析

由于SQL过长，无法实际修改验证，构建以下动态SQL进行验证。

1、union 方式

test=# declare

test-#   v_sql text;

test-# begin

test-#   v_sql:= 'WITH company_user_temp AS (';

test-#   for i in 1..2000 loop

test-#     v_sql:=v_sql||'select '||i||' as company_code from dual union all ';

test-#   end loop;

test-#   v_sql:=substr(v_sql,0,length(v_sql) - 10) ||') select count(*) from company_user_temp';

test-#   execute immediate v_sql;

test-# end;

test-# /

ANONYMOUS BLOCK

Time: 6735.076 ms (00:06.735)

test=#

2、values 方式

test=# declare

test-#   v_sql text;

test-# begin

test-#   v_sql := 'with company_code as (select * from (values(';

test-#   for i in 1..2000 loop

test-#     v_sql:=v_sql||i||'),(';

test-#   end loop;

test-#   v_sql:=substr(v_sql,0,length(v_sql) - 2)||') as company_code ) select count(*) from company_code';

test-#   execute immediate v_sql;

test-# end;

test-# /

ANONYMOUS BLOCK

Time: 10.325 ms

test=#

结论：可以看到，这样修改后，SQL 性能得到了大幅提升。

不当使用 union all 导致的SQL解析时间过长的问题优化的更多相关文章

（转载）处理SQL解析失败导致share pool 的争用
通过关联x$kglcursorx$kglcursor_child_sqlid视图: 通过使用Oracle10035Event事件可以找到解析失败的SQL: 通过oraclesystemdump也可以找 ...
自己实现一个SQL解析引擎
自己实现一个SQL解析引擎功能:将用户输入的SQL语句序列转换为一个可运行的操作序列,并返回查询的结果集. SQL的解析引擎包含查询编译与查询优化和查询的执行,主要包含3个步骤: 查询分析: 制定逻 ...
SQL解析在美团的应用
https://tech.meituan.com/SQL_parser_used_in_mtdp.html 数据库作为核心的基础组件,是需要重点保护的对象.任何一个线上的不慎操作,都有可能给数据库带来 ...
oracle 基础知识(九)----SQL解析
一,解析过程二,硬解析,软解析,软软解析 01,硬解析将SQL语句通过监听器发送到Oracle时, 会触发一个Server process生成,来对该客户进程服务.Server process得到 ...
转载：一文详解SQL解析与应用
转载地址:http://www.elecfans.com/emb/20180618696111.html 数据库作为核心的基础组件,是需要重点保护的对象.任何一个线上的不慎操作,都有可能给数据库带来严 ...
SQL解析器详解
1.概述最近,有同学留言关于SQL解析器方面的问题,今天笔者就为大家分享一下SQL解析器方便的一些内容. 2.内容 2.1 SQL解析器是什么? SQL解析与优化是属于编辑器方面的知识,与C语言这类 ...
Pisa-Proxy 之 SQL 解析实践
SQL 语句解析是一个重要且复杂的技术,数据库流量相关的 SQL 审计.读写分离.分片等功能都依赖于 SQL 解析,而 Pisa-Proxy 作为 Database Mesh 理念的一个实践,对数据库 ...
如何实现一个SQL解析器
作者:vivo 互联网搜索团队- Deng Jie 一.背景随着技术的不断的发展,在大数据领域出现了越来越多的技术框架.而为了降低大数据的学习成本和难度,越来越多的大数据技术和应用开始支持SQL进 ...
requests的content与text导致lxml的解析问题
title: requests的content与text导致lxml的解析问题 date: 2015-04-29 22:49:31 categories: 经验 tags: [Python,lxml, ...

随机推荐

Javaweb_Tomcat配置
1.基本概念 1.1 前言 web开发: web,网页的意思静态web html,css 提供给所有人看的数据始终不会发生改变动态web 淘宝,几乎所有的网站提供给所有人看的数据始终会发生变化, ...
.Net Core 中使用工厂模式
什么是工厂模式工厂模式是最常用的设计模式之一,属于创建型模式. 有点: 解耦,可以把对象的创建和过程分开减少代码量,易于维护什么时候用? 当一个抽象类有多个实现的时候,需要多次实例化的时候,就要 ...
centos 7搭建svn+apache及权限控制
SVN服务器运行模式: 模式1:svn服务器单独运行监听: 3690端口访问: svn://IP 模式2: svn 服务器+ apache : 80 端口访问: http://IP 1. #安装 ...
基于springBoot项目如何配置多数据源
前言有时,在一个项目中会用到多数据源,现在对自己在项目中多数据源的操作总结如下,有不到之处敬请批评指正! 1.pom.xml的依赖引入 <dependency> <groupId& ...
halcon数组的一些使用
没啥好讲的,这里对于不是数组部分的东西就不进行讲解了. area_center(RegionOpening,Area, Row, Column).使用area_center来求区域的中心和面积时,返回 ...
强化学习-学习笔记4 | Actor-Critic
Actor-Critic 是价值学习和策略学习的结合.Actor 是策略网络,用来控制agent运动,可以看做是运动员.Critic 是价值网络,用来给动作打分,像是裁判. 4. Actor-Crit ...
Autograd: 自动求导
Pytorch中神经网络包中最核心的是autograd包,我们先来简单地学习它,然后训练我们第一个神经网络. autograd包为所有在tensor上的运算提供了自动求导的支持,这是一个逐步运行的框架 ...
for循环 --和复合赋值
阶乘 1.n!=1x2x3x4x...xn 2.写出一个程序,让用户输入n,然后计算输出n! *变量: *显然读用户的输入需要一个int的n,然后计算的结果需要用一个变量保存,可以是int的facto ...
Dapr v1.8 正式发布
Dapr是一套开源.可移植的事件驱动型运行时,允许开发人员轻松立足云端与边缘位置运行弹性.微服务.无状态以及有状态等应用程序类型.Dapr能够确保开发人员专注于编写业务逻辑,而不必分神于解决分布式系统 ...
你真的了解JAVA中对象和类、this、super和static关键字吗
作者:小牛呼噜噜 | https://xiaoniuhululu.com 计算机内功.JAVA底层.面试相关资料等更多精彩文章在公众号「小牛呼噜噜」目录 Java对象究竟是什么? 创建对象的过程 ...