新三种求数列中值SQL之效率再比拼

在 https://www.cnblogs.com/xiandedanteng/p/12677688.html 中我列举了三种求中值方案，其中日本人MICK的做法因为不适用于二百万结果集而放弃，取而代之是新方案一。

新方案一：

经过思考后我又得出了一种中值的新解法，那就是利用排序后正向序列和反向序列交叉点为中值区的原理，如果两个序列相减小于等于一则求所在区域的均值即可。

SQL：

select avg(a.salary) from

(select salary,dense_rank() over (order by salary asc) as seq,dense_rank() over (order by salary desc) as revseq from tb_employee order by salary) a where abs(a.seq-a.revseq)<=1

解释计划：

SQL> select avg(a.salary) from

  2  (select salary,dense_rank() over (order by salary asc) as seq,dense_rank() over (order by salary desc) as revseq from tb_employee order by salary) a where abs(a.seq-a.revseq)<=1;

已用时间:  00: 00: 00.00

执行计划

----------------------------------------------------------

Plan hash value: 9035349

---------------------------------------------------------------------------------------------

| Id  | Operation             | Name        | Rows  | Bytes |TempSpc| Cost (%CPU)| Time     |

---------------------------------------------------------------------------------------------

|   0 | SELECT STATEMENT      |             |     1 |    39 |       |  8850   (2)| 00:01:47 |

|   1 |  SORT AGGREGATE       |             |     1 |    39 |       |            |          |

|*  2 |   VIEW                |             |  2000K|    74M|       |  8850   (2)| 00:01:47 |

|   3 |    WINDOW SORT        |             |  2000K|  7812K|    22M|  8850   (2)| 00:01:47 |

|   4 |     WINDOW SORT       |             |  2000K|  7812K|    22M|  8850   (2)| 00:01:47 |

|   5 |      TABLE ACCESS FULL| TB_EMPLOYEE |  2000K|  7812K|       |  3045   (2)| 00:00:37 |

---------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

   2 - filter(ABS("A"."SEQ"-"A"."REVSEQ")<=1)

从Cost看是目前最快的。

执行时间：

SQL> select avg(a.salary) from

  2  (select salary,dense_rank() over (order by salary asc) as seq,dense_rank() over (order by salary desc) as revseq from tb_employee order by salary) a where abs(a.seq-a.revseq)<=1;

AVG(A.SALARY)

-------------

         5500

已用时间:  00: 00: 02.46

从运行时间上看排第二。

经局部优化后两种方案SQL如下：

原有方案二：

select avg(b.salary) from

(select a.salary,abs(a.seq-a.revseq) as diff from (select id,salary,dense_rank() over (order by salary asc) as seq,dense_rank() over (order by salary desc) as revseq from tb_employee order by salary) a ) b

where b.diff=(select min(c.diff) from

(select abs(a.seq-a.revseq) as diff from (select dense_rank() over (order by salary asc) as seq,dense_rank() over (order by salary desc) as revseq from tb_employee order by salary) a ) c)

解释计划：

SQL> select avg(b.salary) from

  2  (select a.salary,abs(a.seq-a.revseq) as diff from (select id,salary,dense_rank() over (order by salary asc) as seq,dense_rank() over (order by salary desc) as revseq from tb_employee order by salary) a ) b

  3  where b.diff=(select min(c.diff) from

  4  (select abs(a.seq-a.revseq) as diff from (select dense_rank() over (order by salary asc) as seq,dense_rank() over (order by salary desc) as revseq from tb_employee order by salary) a ) c);

已用时间:  00: 00: 00.00

执行计划

----------------------------------------------------------

Plan hash value: 3874635296

-----------------------------------------------------------------------------------------------

| Id  | Operation               | Name        | Rows  | Bytes |TempSpc| Cost (%CPU)| Time     |

-----------------------------------------------------------------------------------------------

|   0 | SELECT STATEMENT        |             |     1 |    39 |       | 19969   (2)| 00:04:00 |

|   1 |  SORT AGGREGATE         |             |     1 |    39 |       |            |          |

|*  2 |   VIEW                  |             |  2000K|    74M|       | 11119   (2)| 00:02:14 |

|   3 |    WINDOW SORT          |             |  2000K|    19M|    38M| 11119   (2)| 00:02:14 |

|   4 |     WINDOW SORT         |             |  2000K|    19M|    38M| 11119   (2)| 00:02:14 |

|   5 |      TABLE ACCESS FULL  | TB_EMPLOYEE |  2000K|    19M|       |  3045   (2)| 00:00:37 |

|   6 |    SORT AGGREGATE       |             |     1 |    26 |       |            |          |

|   7 |     VIEW                |             |  2000K|    49M|       |  8850   (2)| 00:01:47 |

|   8 |      WINDOW SORT        |             |  2000K|  7812K|    22M|  8850   (2)| 00:01:47 |

|   9 |       WINDOW SORT       |             |  2000K|  7812K|    22M|  8850   (2)| 00:01:47 |

|  10 |        TABLE ACCESS FULL| TB_EMPLOYEE |  2000K|  7812K|       |  3045   (2)| 00:00:37 |

-----------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

   2 - filter(ABS("A"."SEQ"-"A"."REVSEQ")= (SELECT MIN(ABS("A"."SEQ"-"A"."REVSEQ"))

              FROM  (SELECT DENSE_RANK() OVER ( ORDER BY "SALARY") "SEQ",DENSE_RANK() OVER ( ORDER

              BY INTERNAL_FUNCTION("SALARY") DESC ) "REVSEQ" FROM "TB_EMPLOYEE" "TB_EMPLOYEE" ORDER

              BY "SALARY") "A"))

执行时间：

SQL> select avg(b.salary) from
2 (select a.salary,abs(a.seq-a.revseq) as diff from (select id,salary,dense_rank() over (order by salary asc) as seq,dense_rank() over (order by salary desc) as revseq from tb_employee order by salary) a ) b
3 where b.diff=(select min(c.diff) from
4 (select abs(a.seq-a.revseq) as diff from (select dense_rank() over (order by salary asc) as seq,dense_rank() over (order by salary desc) as revseq from tb_employee order by salary) a ) c);

AVG(B.SALARY)
-------------
5500

已用时间: 00: 00: 04.56

原有方案三：

select avg(a.salary) from

(select

salary,row_number() over (order by salary asc) as seq,row_number() over (order by salary desc) as revseq,(select ceil(count(*)/2) from tb_employee) as ceil

from tb_employee) a

where a.seq=a.ceil or a.revseq=a.ceil

解释计划：

SQL> select avg(a.salary) from

  2  (select

  3  salary,row_number() over (order by salary asc) as seq,row_number() over (order by salary desc) as revseq,(select ceil(count(*)/2) from tb_employee) as ceil

  4  from tb_employee) a

  5  where a.seq=a.ceil or a.revseq=a.ceil;

已用时间:  00: 00: 00.00

执行计划

----------------------------------------------------------

Plan hash value: 3541675306

-----------------------------------------------------------------------------------------------

| Id  | Operation              | Name         | Rows  | Bytes |TempSpc| Cost (%CPU)| Time     |

-----------------------------------------------------------------------------------------------

|   0 | SELECT STATEMENT       |              |     1 |    52 |       | 14656   (3)| 00:02:56 |

|   1 |  SORT AGGREGATE        |              |     1 |    52 |       |            |          |

|   2 |   SORT AGGREGATE       |              |     1 |       |       |            |          |

|   3 |    INDEX FAST FULL SCAN| SYS_C0012264 |  2000K|       |       |  1474   (2)| 00:00:18 |

|*  4 |   VIEW                 |              |  2000K|    99M|       | 14656   (3)| 00:02:56 |

|   5 |    WINDOW SORT         |              |  2000K|  7812K|    22M| 14656   (3)| 00:02:56 |

|   6 |     WINDOW SORT        |              |  2000K|  7812K|    22M| 14656   (3)| 00:02:56 |

|   7 |      TABLE ACCESS FULL | TB_EMPLOYEE  |  2000K|  7812K|       |  3045   (2)| 00:00:37 |

-----------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

   4 - filter("A"."SEQ"="A"."CEIL" OR "A"."REVSEQ"="A"."CEIL")

消耗时间：

SQL> ;

  1  select avg(b.salary) from

  2   (select

  3   salary,row_number() over (order by salary asc) as seq,row_number() over (order by salary desc) as revseq,(select ceil(count(*)/2) from tb_employee) as ceil

  4  - filter("A"."SEQ"="A"."CEIL" OR "A"."REVSEQ"="A"."CEIL")；

  5*  where a.seq=a.ceil or a.revseq=a.ceil

SQL> select avg(a.salary) from

  2  (select

  3  salary,row_number() over (order by salary asc) as seq,row_number() over (order by salary desc) as revseq,(select ceil(count(*)/2) from tb_employee) as ceil

  4  from tb_employee) a

  5  where a.seq=a.ceil or a.revseq=a.ceil;

AVG(A.SALARY)

-------------

         5498

已用时间:  00: 00: 01.98

而单查表数量的解释计划大家也参考看一下：

SQL> select count(*) from tb_employee;

已用时间:  00: 00: 00.01

执行计划

----------------------------------------------------------

Plan hash value: 2866911338

------------------------------------------------------------------------------

| Id  | Operation             | Name         | Rows  | Cost (%CPU)| Time     |

------------------------------------------------------------------------------

|   0 | SELECT STATEMENT      |              |     1 |  1474   (2)| 00:00:18 |

|   1 |  SORT AGGREGATE       |              |     1 |            |          |

|   2 |   INDEX FAST FULL SCAN| SYS_C0012264 |  2000K|  1474   (2)| 00:00:18 |

------------------------------------------------------------------------------

最后的大比拼表格：

方案	Cost	耗时
新方案一	8850	2.46秒
原有方案二	19946	4.56秒
原有方案三	14646	1.98

截至目前，方案三以较高效率胜出，新方案一其实也不错，原有方案三排第三位。

--2020年4月12日--

新三种求数列中值SQL之效率再比拼的更多相关文章

Python max()方法扩展：求字典中值最大的键
重要的应该写在前面[捂脸] 场景一:仅求最大值对应的键,代码如下: >>> dic = {'A':4, 'B':2, 'C':3} >>> max_key = ...
C#中??和？分别是什么意思？在ASP.NET开发中一些单词的标准缩写 C#SESSION丢失问题的解决办法在C#中INTERFACE与ABSTRACT CLASS的区别 SQL命令语句小技巧 JQUERY判断CHECKBOX是否选中三种方法 JS中!=、==、!==、===的用法和区别在对象比较中，对象相等和对象一致分别指的是什么？
C#中??和?分别是什么意思? 在C#中??和?分别是什么意思? 1. 可空类型修饰符(?):引用类型可以使用空引用表示一个不存在的值,而值类型通常不能表示为空.例如:string str=null; ...
【算法随记三】小半径中值模糊的急速实现（16MB图7.5ms实现） + Photoshop中蒙尘和划痕算法解读。
在本人的博客里,分享了有关中值模糊的O(1)算法,详见:任意半径中值滤波(扩展至百分比滤波器)O(1)时间复杂度算法的原理.实现及效果 ,这里的算法的执行时间和参数是无关的.整体来说,虽然速度也很快, ...
java数组中的三种排序方法中的冒泡排序方法
我记得我大学学java的时候,怎么就是搞不明白这三种排序方法,也一直不会,现在我有发过来学习下这三种方法并记录下来. 首先说说冒泡排序方法:冒泡排序方法就是把数组中的每一个元素进行比较,如果第i个元素 ...
Python 列表(List) 的三种遍历(序号和值)方法
三种遍历列表里面序号和值的方法: 最近学习python这门语言,感觉到其对自己的工作效率有很大的提升,特在情人节这一天写下了这篇博客,下面废话不多说,直接贴代码 #!/usr/bin/env pyth ...
[ 原创 ]学习笔记-三种向ListView中填充简单文本的方法
Android 中ListView是很重要的一块内容掌握ListView的基本用法对学习安卓起着举足轻重的作用今天就介绍一下三种向ListView 填充简单文本的方法填充其他数据类型的用法之后 ...
求数列中第K大的数
原创利用到快速排序的思想,快速排序思想:https://www.cnblogs.com/chiweiming/p/9188984.html array代表存放数列的数组,K代表第K大的数,mid代表 ...
C#三种判断数据库中取出的字段值是否为空(NULL) 的方法
操作数据库,需要判断返回的字段值是否为空,收集了3种方法供参考 1 通过System.DBNull判断,网上大部分都使用这个方法. DataTable dt; ...
Spring之jdbcTemplate：查询的三种方式（单个值、单个对象、对象集合）
JdbcTemplateDemo2.java package helloworld.jdbcTemplate; import org.springframework.jdbc.core.JdbcTem ...

随机推荐

xadmin 安装
xadmin 安装环境(一定要一样) Python 3.6.2 Django 2.0 安装 pip install django==2.0, 指定特定的版本 pip install https:// ...
微信公众号如何将PDF上传到公众号？
微信公众号如何将PDF上? 我们都知道创建一个微信公众号,在公众号中发布一些文章是非常简单的,但公众号添加附件下载的功能却被限制,如今可以使用小程序“微附件”进行在公众号中添加附件. 以下是公众号添加 ...
Spring Boot Logback 默认配置
Spring Boot Logback 默认配置标签(空格分隔): Spring Boot Intro(介绍) Spring Boot 1.5.9 默认使用的日志框架是 Logback. 生效的默认 ...
PHP基础之查找
前言之前的文章介绍了PHP的运算符.流程控制.函数.排序等.有兴趣可以去看看. PHP入门之类型与运算符 PHP入门之流程控制 PHP入门之函数 PHP入门之数组 PHP基础之排序下面简单介绍一下 ...
SpringBoot_MyBatisPlus快速入门小例子
快速入门创建一个表我这里随便创建了一个air空气表 idea连接Mysql数据库点击右侧database再点击添加数据库找到Mysql 添加用户名,密码,数据库最后点击测试测试成功后在右侧就 ...
linux系统中SSH免密设置报错
执行 ssh-add ~/.ssh/msi_rsa 时报下面错误 Could not open a connection to your authentication agent. 解决办法: 执行命 ...
2020-03-27：分布式锁的问题，假如a线程在获得锁的情况下网络波动极端情况是断网了，这种情况是怎么处理的
福哥答案2020-04-04:超时释放锁.
C#LeetCode刷题之#58-最后一个单词的长度（Length of Last Word）
问题该文章的最新版本已迁移至个人博客[比特飞],单击链接 https://www.byteflying.com/archives/3927 访问. 给定一个仅包含大小写字母和空格 ' ' 的字符串, ...
C#LeetCode刷题之#205-同构字符串（Isomorphic Strings）
问题该文章的最新版本已迁移至个人博客[比特飞],单击链接 https://www.byteflying.com/archives/3770 访问. 给定两个字符串 s 和 t,判断它们是否是同构的. ...
Aspnet Zero中使用Windows service (Topshelf)来承载Quartz.net任务
Aspnet Zero使用Windows service (Topshelf)来承载Quartz.net任务网上有很多关于如何使用Topshelf创建ABP的Quartz windows服务,但很少 ...

新三种求数列中值SQL之效率再比拼

新三种求数列中值SQL之效率再比拼的更多相关文章

随机推荐

热门专题