理解group by 语句的扩展使用

在SQL的开发中我们会经常使用group by语句对数据进行分组统计，然而在一些复杂的BI报表开发中会常遇到更
复杂的分组需求，单单使用group by 就不能解决我们的问题了，这时我们就需要学习了解一下在group by 语句上的一些扩展使用，下面我们就来学习一下rollup、cube、grouping sets语句的使用。

1.group by

SQL> select a.dname,b.job,sum(b.sal) sum_sal

    from dept a,emp b

    where a.deptno=b.deptno

    group by a.dname,b.job;

DNAME          JOB          SUM_SAL

-------------- --------- ----------

SALES          MANAGER

SALES          CLERK

ACCOUNTING     MANAGER

ACCOUNTING     PRESIDENT

ACCOUNTING     CLERK

RESEARCH       MANAGER

SALES          SALESMAN

RESEARCH       ANALYST

RESEARCH       CLERK           

 rows selected

可以看到以上数据中我们按照部门名和职位名进行了分组，然后求出每组内的工资数。
假如现在我们有一个需求，需要在这个查询中增加一个不同部门间的工资总和，那么这个SQL该怎么写：

我们是不是会这样写：

SQL> select * from (

    SELECT  a.dname,b.job,SUM(b.sal) sum_sal

    FROM dept a,emp b

    WHERE a.deptno = b.deptno

    GROUP  BY a.dname,b.job

    UNION ALL

    --部门的小计

    SELECT  a.dname,NULL, SUM(b.sal) sum_sal

    FROM dept a,emp b

   WHERE a.deptno = b.deptno

   GROUP  BY a.dname

   UNION ALL

   --所有部门总的合计

   SELECT  NULL,NULL, SUM(b.sal) sum_sal

   FROM dept a,emp b

   WHERE a.deptno = b.deptno)

   order by dname;

DNAME          JOB          SUM_SAL

-------------- --------- ----------

ACCOUNTING

ACCOUNTING     MANAGER

ACCOUNTING     PRESIDENT

ACCOUNTING     CLERK

RESEARCH       CLERK

RESEARCH       MANAGER

RESEARCH

RESEARCH       ANALYST

SALES          CLERK

SALES          MANAGER

SALES          SALESMAN

SALES                          

 rows selected

可以看到上面的SQL写法实现了之前的需求，但是执行效率将非常低，dept表和emp表将会被多次扫描，
能否一次扫描就能搞定这个事哪，答案的肯定的，使用rollup函数。

2.group by rollup

SQL> select a.dname,b.job,sum(b.sal) sum_sal

    from dept a,emp b

    where a.deptno=b.deptno

    group by rollup(a.dname,b.job);

DNAME          JOB          SUM_SAL

-------------- --------- ----------

SALES          CLERK

SALES          MANAGER

SALES          SALESMAN

SALES

RESEARCH       CLERK

RESEARCH       ANALYST

RESEARCH       MANAGER

RESEARCH

ACCOUNTING     CLERK

ACCOUNTING     MANAGER

ACCOUNTING     PRESIDENT

ACCOUNTING                     

 rows selected

通过上面的查询可以看到使用rollup函数我们一次就实现了上面的需求，而且dept表和emp表将只会被扫描一次，可以通过查询执行计划要来验证(略)。

group by rollup(a.dname,b.job)
分组是这样的：
1.首先对a.dname,b.job进行联合分组，求出sum
2.其次对a.dname进行分组，求出sum
3.最后按全表进行分组求出sum

可能有些人对于上面union all的写法还能接受，决定实现起来不难而且很好理解，但是我要说的是如果是需求再改变，在增加求出对雇佣年份的统计，是不是又要union all了，这就显得sql很冗肿了，效率下降，你还能接受吗？如果现在我们的需求又改变了，我们(a.dname,b.job)在前面的基础上增加对 b.job进行分组求和，这时该怎么做那，。。。。这时就需要我们使用cube函数。

3.group by cube

SQL> select a.dname,b.job,sum(b.sal) sum_sal

    from dept a,emp b

    where a.deptno=b.deptno

    group by cube(a.dname,b.job);

DNAME          JOB          SUM_SAL

-------------- --------- ----------

               CLERK

               ANALYST

               MANAGER

               SALESMAN

               PRESIDENT

SALES

SALES          CLERK

SALES          MANAGER

SALES          SALESMAN

RESEARCH

RESEARCH       CLERK

RESEARCH       ANALYST

RESEARCH       MANAGER

ACCOUNTING

ACCOUNTING     CLERK

ACCOUNTING     MANAGER

ACCOUNTING     PRESIDENT       

 rows selected

通过上面的sql查询我们发现cube函数是rollup函数基础上更细化的分组，在rollup的基础上又增加了对job的分组，是不是这样的那??? 通过上面的查询发现使用rollup函数有13条数据，相同数据的情况下使用cube函数有18条数据，那么多出的5条数据就是对job的分组，查询一下job有种：

SQL> select distinct job from emp;

JOB

---------

CLERK

SALESMAN

PRESIDENT

MANAGER

ANALYST

可以看到正好有5种job，验证了上面的问题。

group by cube(a.dname,b.job)
分组是这样的：
1.首先按照a.dname,b.job进行分组，求聚合函数的值
2.其次按照a.dname进行分组,求聚合函数的值
3.再次按照b.job进行分组，求聚合函数的值
4.最后对全表进行分组，求聚合函数的值

如果是三列数据那：

group by cube(a.dname,b.job,b.hiredate)

分组是这样的：
1.首先按照a.dname,b.job,b.hiredate进行分组，求聚合函数的值
2.然后按照a.dname,b.job进行分组，求聚合函数的值
3.然后按照a.dname,b.hiredate进行分组，求聚合函数的值
4.然后按照b.job,b.hiredate进行分组，求聚合函数的值
5.然后按照a.dname进行分组，求聚合函数的值
6.然后按照b.job进行分组，求聚合函数的值
7.然后按照b.hiredate进行分组，求聚合函数的值
8.最后按照全表进行分组，求聚合函数的值

例如：

SQL> select a.dname,b.job,b.hiredate,sum(b.sal) sum_sal

    from dept a,emp b

    where a.deptno=b.deptno

    group by cube(a.dname,b.job,b.hiredate);

DNAME          JOB       HIREDATE       SUM_SAL

-------------- --------- ----------- ----------

                         //

                         //

                         //

                         //

                         //

                         //

                         //

                         //

                         //

                         //

                         //

                         //

                         //

               CLERK

               CLERK     //

               CLERK     //

               CLERK     //

               CLERK     //

               ANALYST

               ANALYST   //

               ANALYST   //

               MANAGER

               MANAGER   //

               MANAGER   //

               MANAGER   //

               SALESMAN

               SALESMAN  //

               SALESMAN  //

               SALESMAN  //

               SALESMAN  //

               PRESIDENT

               PRESIDENT //

SALES

SALES                    //

SALES                    //

SALES                    //

SALES                    //

SALES                    //

SALES                    //

SALES          CLERK

SALES          CLERK     //

SALES          MANAGER

SALES          MANAGER   //

SALES          SALESMAN

SALES          SALESMAN  //

SALES          SALESMAN  //

SALES          SALESMAN  //

SALES          SALESMAN  //

RESEARCH

RESEARCH                 //

RESEARCH                 //

RESEARCH                 //

RESEARCH                 //

RESEARCH                 //

RESEARCH       CLERK

RESEARCH       CLERK     //

RESEARCH       CLERK     //

RESEARCH       ANALYST

RESEARCH       ANALYST   //

RESEARCH       ANALYST   //

RESEARCH       MANAGER

RESEARCH       MANAGER   //

ACCOUNTING

ACCOUNTING               //

ACCOUNTING               //

ACCOUNTING               //

ACCOUNTING     CLERK

ACCOUNTING     CLERK     //

ACCOUNTING     MANAGER

ACCOUNTING     MANAGER   //

ACCOUNTING     PRESIDENT

ACCOUNTING     PRESIDENT //        

 rows selected

如果分别按照a.dname,b.job,b.hiredate进行分组求和，我们是不是可以放在一个SQL中实现，
答案的可以的，我们可以利用grouping sets函数

4.group by grouping sets

SQL> select a.dname,b.job,b.hiredate,sum(b.sal) sum_sal

    from dept a,emp b

    where a.deptno=b.deptno

    group by grouping sets (a.dname,b.job,b.hiredate);

DNAME          JOB       HIREDATE       SUM_SAL

-------------- --------- ----------- ----------

                         //

                         //

                         //

                         //

                         //

                         //

                         //

                         //

                         //

                         //

                         //

                         //

                         //

               CLERK

               SALESMAN

               PRESIDENT

               MANAGER

               ANALYST

ACCOUNTING

RESEARCH

SALES                                      

 rows selected

通过上面的查询我们就很一目了然看到他们的分组规律。

group by grouping sets (a.dname,b.job,b.hiredate)
分组是这样的：
1.首先按照a.dname进行分组，求聚合函数的值
2.其次按照b.job进行分组，求聚合函数的值
1.最后按照b.hiredate进行分组，求聚合函数的值

5.总结归类下

Rollup是在group by的基础上再进行分级的汇总，例如：Rollup(A,B,C)的分组顺序是：
(A,B,C)
(A,B)
(A)
最后对全表进行group by 分组。

Cube是在Rollup的基础上再进行更加细粒度的汇总，例如：cube(A,B,C)它的分组顺序是：
(A,B,C)
(A,B)
(A,C)
(A)
(B,C)
(B)
(C)
最后对全表进行group by 分组。

Grouping sets与rollup和cube不同，它只是对单列进行分组，例如grouping sets(A,B,C)的分组顺序是:
(A)
(B)
(C)

可参考：

http://love-flying-snow.iteye.com/blog/573083

理解group by 语句的扩展使用的更多相关文章

[Oracle] Group By 语句的扩展 - Rollup、Cube和Grouping Sets
常常写SQL语句的人应该知道Group by语句的主要使用方法是进行分类汇总,以下是一种它最常见的使用方法(依据部门.职位分别统计业绩): SELECT a.dname,b.job,SUM(b.sal ...
深入理解group by 语句的执行顺序 from→where→group by→select（含聚合函数）
由于之前没有对group by 语句的执行顺序(执行原理)做深入的了解,所以导致在实际应用过程中出现了一些问题.举个简单的粟子,比如一个表testA中的所有数据如下图: 我现在想从testA中查询us ...
如何理解group by语句
参考文章: https://blog.csdn.net/hao1066821456/article/details/69556644 如何实现一对多关系,得到一行多列的显示方式: group by可以 ...
可以这样去理解group by和聚合函数
写在前面的话:用了好久group by,今天早上一觉醒来,突然感觉group by好陌生,总有个筋别不过来,为什么不能够select * from Table group by id,为什么一定不能是 ...
可以这样去理解group by和聚合函数(转)
http://www.cnblogs.com/wuguanglei/p/4229938.html 写在前面的话:用了好久group by,今天早上一觉醒来,突然感觉group by好陌生,总有个筋别不 ...
一文让你彻底理解group by和聚合函数
知道group by是进行分组查询,但是一直觉得对其理解得不够透彻,在网上扒了一篇文章,我认为写得非常好. 为什么不能够select * from Table group by id,为什么一定不能是 ...
SQL GROUP BY 语句
合计函数 (比如 SUM) 常常需要添加 GROUP BY 语句. GROUP BY 语句 GROUP BY 语句用于结合合计函数,根据一个或多个列对结果集进行分组. SQL GROUP BY 语法 ...
（转载）SQL语句中Group by语句的详细介绍
转自:http://blog.163.com/yuer_d/blog/static/76761152201010203719835 SQL语句中Group by语句的详细介绍 ...
GROUP BY语句与HAVING语句的使用
一.GROUP BY GROUP BY语句用来与聚合函数(aggregate functions such as COUNT, SUM, AVG, MIN, or MAX.)联合使用来得到一个或多个列 ...

随机推荐

Swift3.0语言教程替换子字符串
Swift3.0语言教程替换子字符串 Swift3.0语言教程替换子字符串,替换子字符串其实就是将字符串中的子字符串删除,然后再进行添加.为了让这一繁琐的过程变的简单,NSString提供了替换子字符 ...
C++11 std::chrono库详解
所谓的详解只不过是参考www.cplusplus.com的说明整理了一下,因为没发现别人有详细讲解. chrono是一个time library, 源于boost,现在已经是C++标准.话说今年似乎又 ...
localhost和127.0.0.1 的区别
wpf,ListBox,ScrollViewer内容向左向右偏移指定位置
public partial class Example : UserControl { private ScrollViewer myScrollViewer; public Example() { ...
UITextField最大字符数和最大字节数的限制
UITextView,UITextfield中有很多坑,网上的方法也很多,但是用过之后暂时没有发现一个好用.这里我给大家几组测试用例可以一试,为啥不好用. 限制10个字节,输入2个Emoj之后是8个字 ...
ps去水印
使用仿制图章工具去除使用仿制图章工具去除文字这是比较常用的方法,具体的操作是,选取仿制图章工具,按住Alt键,在无文字区域点击相似的色彩名图案采样,然后在文字区域拖动鼠标复制以覆盖文字.要注意的是,采 ...
测试你是否和LTC水平一样高[HDU1407]
测试你是否和LTC水平一样高Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total ...
Google Chrome开发者工具
Google Chrome开发者工具是内嵌到浏览器的开发工具,打开方式有两种:第一“按F12”,第二:shift+ctrl+i(火狐.360等浏览器也可以这么用) Console介绍 Console ...
Storm系统高可用性HA表现
关于Storm的高可用,有以下几个方面: (1)数据利用阶段可以通过ACK机制保证数据被处理: (2)在进程级别,worker失效,supervisor会自动重启worker线程; (3)在组件级别, ...
使用Adobe Edge Inspect在各种设备中轻松测试同一页面
有过移动网站开发经历的开发者都知道,在各种设备中测试同一页面是一项非常繁琐的工作.现在,我们可以使用Adobe Edge Inspect来简化这一工作.如果使用Edge Inspect,可以在各种设备 ...

理解group by 语句的扩展使用

理解group by 语句的扩展使用的更多相关文章

随机推荐

热门专题