Oracle学习笔记:窗口函数
SQL中的聚合函数,顾名思义是聚集合并的意思,是对某个范围内的数值进行聚合,聚合后的结果是一个值或是各个类别对应的值。直接聚合得到的结果是所有数据合并,分组聚合(group by)得到的结果是分组合并。
这种聚合函数得到的数据行数是小于基础数据行数的,但是我们经常会有这样的需求,就是既希望看基础数据同时也希望查看聚合后的数据,这个时候聚合函数就满足不了我们了,窗口函数就派上用场了。窗口函数就是既可以显示原始基础数据也可以显示聚合数据。
1.测试数据
学习当然不能凭空想象,需要大量的实践来提高学习效果。
先编排测试数据。
-- 创建测试表
create table temp_cwh_window
(
shopname varchar(10),
sales number,
date2 date
);
-- 插入数据
insert into temp_cwh_window values('淘宝','50',to_date('20191013','yyyymmdd'));
insert into temp_cwh_window values('淘宝','35',to_date('20191014','yyyymmdd'));
insert into temp_cwh_window values('淘宝','63',to_date('20191015','yyyymmdd'));
insert into temp_cwh_window values('天猫','15',to_date('20191013','yyyymmdd'));
insert into temp_cwh_window values('天猫','59',to_date('20191014','yyyymmdd'));
insert into temp_cwh_window values('天猫','63',to_date('20191015','yyyymmdd'));
insert into temp_cwh_window values('京东','159',to_date('20191013','yyyymmdd'));
insert into temp_cwh_window values('京东','32',to_date('20191014','yyyymmdd'));
insert into temp_cwh_window values('京东','59',to_date('20191015','yyyymmdd'));
-- 查询
select * from temp_cwh_window;
| 序号 | shopname | sales | date2 |
|---|---|---|---|
| 1 | 淘宝 | 50 | 2019/10/13 |
| 2 | 淘宝 | 35 | 2019/10/14 |
| 3 | 淘宝 | 63 | 2019/10/15 |
| 4 | 天猫 | 15 | 2019/10/13 |
| 5 | 天猫 | 59 | 2019/10/14 |
| 6 | 天猫 | 63 | 2019/10/15 |
| 7 | 京东 | 159 | 2019/10/13 |
| 8 | 京东 | 32 | 2019/10/14 |
| 9 | 京东 | 59 | 2019/10/15 |
2.聚合函数+over()
over()的作用就是告诉SQL引擎:按区域对数据进行分区,然后累计每个切片的总额,再全部展示。
over函数指明在那些字段上做分析,其内跟Partition by表示对数据进行分组。注意Partition by可以有多个字段。
over函数可以和其它聚集函数、分析函数搭配,起到不同的作用。例如sum,还有诸如rank,dense_rank, min, max等。
- 平均销量
select shopname,
sales,
date2,
avg(sales) over()
from temp_cwh_window;
3.partition by子句
使用partition by子句可以进行分组操作,类似于group by,需要与over()搭配使用。
select shopname,
sales,
date2,
avg(sales) over(partition by shopname)
from temp_cwh_window;
4.order by子句
使用order by子句可以按照某一列数值进行排序,可与序列函数ntile、row_number、lag、lead、first_value、last_value等结合使用。
当 order by 与聚合函数一起使用时,是顺序聚合的。类似于累计和的效果,截止当前行的累计,这里需要特别注意。
select shopname,
sales,
date2,
sum(sales) over(partition by shopname order by date2)
from temp_cwh_window;
-- 运行结果
1 京东 159 2019/10/13 159
2 京东 32 2019/10/14 191
3 京东 59 2019/10/15 250
4 淘宝 50 2019/10/13 50
5 淘宝 35 2019/10/14 85
6 淘宝 63 2019/10/15 148
7 天猫 15 2019/10/13 15
8 天猫 59 2019/10/14 74
9 天猫 63 2019/10/15 137
当order by与序列函数一起使用时用于排序。
5.序列函数
序列函数,就是可以将数据整理成一个有序的序列,然后可以在这个序列里面挑选我们想要的序列对应的数据。
5.1 分析函数之 ntile
ntile函数对一个数据分区中的有序结果集进行划分,将其分组为各个桶,并为每个小组分配一个唯一的组编号。默认是对表在不做任何操作之前进行切片分组的。
注:必须要加order by
- 随机切分为3组
select shopname,
sales,
date2,
ntile(3) over(order by null)
from temp_cwh_window;
- 先分组排序再切分
select shopname,
sales,
date2,
ntile(3) over(partition by shopname order by sales)
from temp_cwh_window;
- 空值排最后
select shopname,
sales,
date2,
ntile(3) over(partition by shopname order by sales desc nulls last)
from temp_cwh_window;
5.2 分析函数之 row_number
row_number() 从 1 开始,按照顺序(注意这里是顺序不是排序)生成该条数据在分组内的对应的序列数,row_number() 的值不会存在重复,当排序的值相同时,按照表中记录的顺序进行排列。
row_number() 一般需要与 order by 进行结合使用。
rank是不连续排名函数(1,1,3,3,5),dense_rank 是连续排名函数(1,1,2,2,3)。
select shopname,
sales,
date2,
row_number() over(partition by shopname order by date2) as rank
from temp_cwh_window;
然后只需要将 rank = 1 部分数据取出即可。
5.3 分析函数之 lag、lead
lag 的英文意思是滞后,而 lead 的英文意思是超前。
对应的 lag 是让数据向后移动,而 lead 是让数据向前移动。
select shopname,
sales,
date2,
lag(date2,1) over(partition by shopname order by date2)
from temp_cwh_window;
-- 结果
1 京东 159 2019/10/13
2 京东 32 2019/10/14 2019/10/13
3 京东 59 2019/10/15 2019/10/14
4 淘宝 50 2019/10/13
5 淘宝 35 2019/10/14 2019/10/13
6 淘宝 63 2019/10/15 2019/10/14
7 天猫 15 2019/10/13
8 天猫 59 2019/10/14 2019/10/13
9 天猫 63 2019/10/15 2019/10/14
select shopname,
sales,
date2,
lead(date2,1) over(partition by shopname order by date2)
from temp_cwh_window;
-- 结果
1 京东 159 2019/10/13 2019/10/14
2 京东 32 2019/10/14 2019/10/15
3 京东 59 2019/10/15
4 淘宝 50 2019/10/13 2019/10/14
5 淘宝 35 2019/10/14 2019/10/15
6 淘宝 63 2019/10/15
7 天猫 15 2019/10/13 2019/10/14
8 天猫 59 2019/10/14 2019/10/15
9 天猫 63 2019/10/15
5.4 分析函数之 first_value、last_value
first_value 和 last_value 都是顾名思义,就是获取第一个值和最后一个值。
但是不是真正意义上的第一个或最后一个,而是截至到当前行的第一个或最后一个。
select shopname,
sales,
date2,
first_value(date2) over(partition by shopname order by date2),
last_value(date2) over(partition by shopname order by date2)
from temp_cwh_window;
-- 结果
1 京东 159 2019/10/13 2019/10/13 2019/10/13
2 京东 32 2019/10/14 2019/10/13 2019/10/14
3 京东 59 2019/10/15 2019/10/13 2019/10/15
4 淘宝 50 2019/10/13 2019/10/13 2019/10/13
5 淘宝 35 2019/10/14 2019/10/13 2019/10/14
6 淘宝 63 2019/10/15 2019/10/13 2019/10/15
7 天猫 15 2019/10/13 2019/10/13 2019/10/13
8 天猫 59 2019/10/14 2019/10/13 2019/10/14
9 天猫 63 2019/10/15 2019/10/13 2019/10/15
Oracle学习笔记:窗口函数的更多相关文章
- Oracle学习笔记三 SQL命令
SQL简介 SQL 支持下列类别的命令: 1.数据定义语言(DDL) 2.数据操纵语言(DML) 3.事务控制语言(TCL) 4.数据控制语言(DCL)
- oracle学习笔记第一天
oracle学习笔记第一天 --oracle学习的第一天 --一.几个基础的关键字 1.select select (挑选) 挑选出显示的--列--(可以多列,用“,”隔开,*表示所有列),为一条 ...
- Oracle学习笔记——点滴汇总
Oracle学习笔记——点滴汇总 http://www.botangdb.com/ Oracle GI = Grid Infrastructure = ASM + Cluster
- Oracle学习笔记之四sp1,Oracle 11g的常用函数
从Oracle学习笔记之四,SQL语言入门中摘出来的,独立成一章节 3.1 字符类函数 ASCII(c)和CHR(i) 分别用于返回一个字符的ASCII码和返回给定ASCII值所对应的字符. C ...
- Oracle学习笔记之四,SQL语言入门
1. SQL语言概述 1.1 SQL语言特点 集合性,SQL可以的高层的数据结构上进行工作,工作时不是单条地处理记录,而对数据进行成组的处理. 统一性,操作任务主要包括:查询数据:插入.修改和删除数据 ...
- Oracle学习笔记—数据字典和常用命令(转载)
转载自: oracle常用数据字典和SQL语句总结 Oracle常用命令大全(很有用,做笔记) 一.Oracle数据字典 数据字典是Oracle存放有关数据库信息的地方,其用途是用来描述数据的.比如一 ...
- oracle学习笔记(一)用户管理
--oracle学习第一天 --连接 @后面连接数据库实例,具体连接到那个数据库 conn scott/tiger@MYORA1; --修改密码 passw; --显示用户 show user; -- ...
- 吴裕雄--天生自然 oracle学习笔记:oracle理论学习详解及各种简单操作例子
1. 数据库的发展过程 层次模型 -->网状模型 -->关系模型 -->对象关系模型 2. 关于数据库的概念 DB:数据库(存储信息的仓库) DBMS:数据库管理系统(用于管理数据库 ...
- Oracle 学习笔记 11 -- 视图 (VIEW)
本次必须学习一个全新的概念-- 视图 (VIEW).在前面的笔记中曾提到过,数据对象包含:表.视图.序列.索引和同义词.前面的笔记都是对表的想剖析,那么本次笔记就对视图的世界进行深入的剖析. 视图是通 ...
随机推荐
- Mac 卸载mysql
sudo rm /usr/local/mysql sudo rm -rf /usr/local/mysql* sudo rm -rf /Library/StartupItems/MySQLCOM su ...
- 数据库 | Oracle数据库查表空间使用情况
平时在使用Oracle的时候,如果业务中的数据量激增.数据量变大,很有可能就会有表空间不足的情况,需要重点关注.今天我们分享下如何查看表空间的使用情况. 一.如何查看使用状况 我们废话不说,先直接贴上 ...
- Android RecyclerView实现加载多种条目类型
今天咱们是用RecyclerView来实现这个多种Item的加载. 其实最关键的是要复写RecyclerView的Adapter中的getItemViewType()方法 这个方法就根据条件返回条目的 ...
- 微pe安装原版win10怎么装|wepe安装原版win10 1803教程
http://www.xitongcheng.com/jiaocheng/xtazjc_article_42199.html 怎么制作wepe启动盘?微pe是一款全新高效.多功能pe维护工具箱,同时支 ...
- 对于ssh服务的简单配置,似的自己的服务器更加安全
对于一台服务器,最大的问题莫过于安全.没有安全性的服务器即使再牛*,性能再好,作用再大,也是分分钟被人搞定,而且还是揉虐性的...当然万事没有绝对的安全,我们只是将危险降低而已.本文只针对于ssh服务 ...
- PyQt5中QTableWidget设置列宽大小的几种方式
我们在使用QTableWidget的时候,经常会出现列宽大小和我们想象不一致的情况,如下图: 内容不能完全显示,需要手动调整列宽才能显示完全. 还有如下图: 因此需要我们擅于调整列宽为我们所使用,现将 ...
- 第10课.c++的新成员
1.动态内存分配 a.c++中通过new关键字进行动态内存申请 b.c++中的动态内存申请是基于类型进行的 c.delete关键字用于内存释放 2.new关键字与malloc函数的区别 a.new关键 ...
- JS中常用的语法
在做前端中,JS的语法尤为重要..没有它,就没有你的未来吧.. 下面将一些常用的JS语法给大家罗列出来.. 也给自己备份一下.. 以备不时之需.. 1.输出语句:document.write(&quo ...
- 第五周课程总结&实验报告(四)
第五周课程总结 本周主要学习了 1.抽象类 抽象类的定义格式 abstract class抽象类名称{ 属性; 访问权限返回值类型方法名称(参数){ //普通方法 [return返回值]; } 访问权 ...
- JAVA实验报告及第八周总结
JAVA第八周作业 实验报告六 实验一 编写一个类,在其main()方法中创建一个一维数组,在try字句中访问数组元素,使其产生ArrayIndexOutOfBoundsException异常.在ca ...