hive group by聚合函数增强

1.grouping sets

grouping sets子句都可以根据UNION连接的多个GROUP BY查询进行逻辑表示

SELECT a，b，SUM（c）FROM tab1 GROUP BY a，b GROUPING SETS（（a，b），a，b，（））

等价于

SELECT a，b，SUM（c）FROM tab1 GROUP BY a，b

union

SELECT a，null，SUM（c）FROM tab1 GROUP BY a，null

union

SELECT null，b，SUM（c）FROM tab1 GROUP BY null，b

union

SELECT null，null，SUM（c）FROM tab1

2.GROUPING__ID

注意是两个下划线相连,说明聚合结果是属于(grouping sets)哪一个子集的的。

SELECT key, value, GROUPING__ID,count(*)

FROM T1

GROUP BY key, value

GROUPING SETS（（key，value），key，value）

;

等价于

SELECT key, value,1,count(*) -- 属于第1个GROUPING SETS子集,即（key，value）

FROM T1

GROUP BY key, value

union

SELECT key, NULL,2,count(*) -- 属于第2个GROUPING SETS子集,即key

FROM T1

GROUP BY key

union

SELECT NULL, value,3,count(*) -- 属于第3个GROUPING SETS子集,即value

FROM T1

GROUP BY value

3.WITH CUBE

CUBE是是group by字段的所有组合

GROUP BY a，b，c WITH CUBE

等同于

GROUP BY a,b,c GROUPING SETS（（a,b,c），（a,b）,（b,c）, （a,c）,（a），（b），（c），（））

4.WITH ROLLUP

ROLLUP子句与GROUP BY一起用于计算维度的层次结构级别的聚合。

GROUP BY a，b，c，WITH ROLLUP

等同于

GROUP BY a，b，c GROUPING SETS（（a，b，c），（a，b），（a），（））

官网文档

hive group by聚合函数增强的更多相关文章

[Hive_11] Hive 的高级聚合函数
0. 说明 Hive 的高级聚合函数 union all | grouping sets | cube | rollup pv //page view 页面访问量 uv //user view 访问人 ...
GROUP BY 聚合函数(max min sum avg count) 和HAVING的使用
重新复习一下这个都源自于我经常需要查的一个需求 “要找到表里面出现了两次或者三次的某个字段” 现在假设有一张表字段是 +----+---------------------+------------ ...
mysql 数据操作单表查询 group by 聚合函数
强调: 如果我们用unique的字段作为分组的依据,则每一条记录自成一组,这种分组没有意义多条记录之间的某个字段值相同,该字段通常用来作为分组的依据如果按照每个字段都是唯一的进行分组,意味着按照这 ...
mysql 数据操作单表查询 group by 聚合函数没有group by情况下
聚合函数只能用在组里使用 #没有group by 则默认算作一组取出所有员工的最高工资 mysql> select max(salary) from employee; +---------- ...
SQL SERVER 2012 第三章 T-SQL 基本语句 group by 聚合函数
select Name,salesPersonID From Sales.store where name between 'g' and 'j' and salespersonID > 283 ...
Hive高阶聚合函数 GROUPING SETS、Cube、Rollup
-- GROUPING SETS作为GROUP BY的子句,允许开发人员在GROUP BY语句后面指定多个统计选项,可以简单理解为多条group by语句通过union all把查询结果聚合起来结合起 ...
sql group by聚合函数
如何让分组后count计算结果为0的记录也显示
9.hive聚合函数，高级聚合，采样数据
本文主要使用实例对Hive内建的一些聚合函数.分析函数以及采样函数进行比较详细的讲解. 一.基本聚合函数数据聚合是按照特定条件将数据整合并表达出来,以总结出更多的组信息.Hive包含内建的一些基本聚 ...
hive学习笔记之十：用户自定义聚合函数(UDAF)
欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos 本篇概览本文是<hive学习笔记>的第十 ...

随机推荐

python使用rabbitMQ介绍五（话题模式）
一.模式介绍话题模式(Topic)基本思想和路由模式是一样的,只不过路由键支持模糊匹配,符号“#”匹配一个或多个词,符号“*”匹配不多不少一个词话题模式相当于消息的模糊匹配,或者按照正则匹配.其中 ...
HDU 6152 - Friend-Graph
Friend-Graph Time Limit: 10000/5000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Tot ...
Jar 初步
前言 jar 是 java 文件中一种文件格式,用于将 .java 文件编译的字节码文件打包成 jar. 给 Java 应用打包 1. 新建一个 java 源文件 package cn.szxy; p ...
使用git 遇见的错误使用到的命令
查看远端地址 git remote -v 需要重新添加地址 git remote set-url origin xxx 远程新的地址 git remote add origin_new 设置用户名 ...
二）Spring AOP编程思想与动态代理
一.aop编程思想 1.面向切面,就是能够不动源码的情况下,从横切面切入新的代码功能. 2.实现原理是动态代理动态代理的步骤 a.写生产厂家,实现接口,代理只能代理接口 b.动态代理类实现Invoc ...
PHP字符串函数、常量、数组排序
PHP字符串函数.常量.数组排序 strlen() 说明:strlen(),可以统计字符串长度用途:strlen() 常用于循环和其他函数,在确定字符串何时结束很重要时.(例如,在循环中,我们也许需 ...
Elastic Stack-Elasticsearch使用介绍(六)
一.前言很久没有更新博客,实在对不住大家.从10月份假期以后我就开始优化程序,来应对双11,这段时间确实很忙,不好意思.好在优化效果还不错,我负责的模块在双11期间没有任何大问题,整体效果还 ...
C# 查看EF生成的SQL语句
用sqlsever追踪最后的sql语句. 返回IQueryable<T>类型, 里面封装的就是生成的SQL脚本,设置断点queryable = DataContext.Set<T&g ...
java基础-02数据类型
基本类型整数 byte byte 数据类型是8位.有符号的,以二进制补码表示的整数最小值是 -128(-2^7) 最大值是 127(2^7-1) 默认值是 0 byte 类型用在大型数组中节约空间 ...
NW.js使用及打包
简介 NW.js (原名 node-webkit)是一个结合了 Chromium 和 node.js 的应用运行时,通过它可以用 HTML 和 JavaScript 编写原生应用程序.它还允许开发者从 ...

hive group by聚合函数增强

1.grouping sets

2.GROUPING__ID

3.WITH CUBE

4.WITH ROLLUP

hive group by聚合函数增强的更多相关文章

随机推荐

热门专题