SQL中的row_number() over()解释
有一个面试题目, 有一张表,如下:
event_type value time
:
- :
:
:
:
:
需要按照event_type排序,返回同一个event_type的,最近时间和次近时间的两个value的差值.
比如event_type为2的,最近时间是14:48,value值为2
接下来的次近时间是12:54,value值为7. 所以差值为 2-7 = -5
所以整个表按照这个规则的结果是
event_type value
-
要实现这个功能,需要使用到SQL中的row_number()函数。 在MSDN上,row_number()函数语法如下:
ROW_NUMBER ( )
OVER ( [ PARTITION BY value_expression , ... [ n ] ] order_by_clause )
通过该语法可以看出,row_number的over里面有两个参数。一个是partition by, 另一个是order by
其中, partition by 是可选参数,可以写可以不写
order by 是必选参数,必须要有.
为了更好的明白如何使用它,我举个例子如下
表 TESTDB
首先,仅仅使用ROW_NUMBER() 中的必选参数, SQL语句如下
SELECT *, ROW_NUMBER() OVER(ORDER BY A DESC) NUM FROM TESTDB
返回结果集如下:
可以看出,它就是单纯的按照A列进行降序排序,然后每一行加了一个行号
那么,如果加上partition by 之后呢 (partition的中文解释是: 划分,分开,分割,区分),会出现什么效果,语句如下:
SELECT *, ROW_NUMBER() OVER(PARTITION BY A ORDER BY A) NUM FROM TESTDB
返回结果集如下:
从这个结果可以看出,partition by A,是以A进行了分组划分。对于A=A1的那三行,标上行号1,2,3
对于A=A2的那三行,重新标上行号1,2,3 而不是接上A1的行号,变成4,5,6...
我们知道聚合函数Group by 也是可以用来分组,那和这里的PARTITION BY 有啥区别呢
Group by 聚合函数一般只有一条反映统计值的记录
而Partition by 能返回一个分组中的多条记录,partition by 用于给结果集分组,如果没有指定那么它把整个结果集作为一个分组.
以下是一些使用ROW_NUMBER()函数的实例
1. 使用row_number()函数进行编号,eg:
select email, customerID, ROW_NUMBER() over(order by psd) as rows from QT_Customer
原理: 先按照psd进行排序,排序完成后,给每天数据进行编号
2. 在订单中按价格的升序进行排序,并给每条记录进行排序代码如下:
select DID, customerID, totalPrice, ROW_NUMBER() over(order by totalPrice) as rows from OP_Order
3. 统计出每一个客户的所有订单并按每一个客户下的订单的金额 升序排序,同时给每一个客户的订单进行编号。这样,就知道每个客户下几单了
select ROW_NUMBER() over(partition by customerID order by totalPrice) as rows, customerID, totalPrice, DID from OP_Order
4. 统计每一个客户最近下的订单是第几次下的订单
with tabs as (select ROW_NUMBER() over(partition by customerID order by totalPrice) as rows, customerID, totalPrice, DID from OP_Order) select MAX(rows) AS '下单次数', customerID from tabs group by customerID.
5. 统计每一个客户所有的订单中购买的金额最小,而且统计订单中,客户是第几次购买
思路: 利用临时表来执行这一个操作
1) 先按客户进行分组,然后按照客户的下单的时间进行排序,并进行编号
2) 然后利用子查询查找出每一个客户购买时的最小价格
3) 根据查找出每一个客户的最小价格来查找相应的记录
with tabs as (select ROW_NUMBER() over(partition by customerID order by insDT) as rows, customerID,totalPrice, DID from OP_Order)
select * from tabs where totalPrice in (select MIN(totalPrice) from tabs group by customerID)
6. 筛选出客户第一次下的订单
思路: 利用rows=1来查询客户第一次下的订单记录
with tabs as (select ROW_NUMBER() over(partition by customerID order by insDT) as rows, * from OP_Order)
select * from tabs where rows =1
7. 在使用over等开窗函数时,over里头的分组及排序的执行晚于"where,group by, order by"的执行
eg: select ROW_NUMBER() over(partition by customerID order by insDT) as rows, customerID, totalPrice, DID from OP_Order where insDT > '2011-07-22'
以上代码是先执行where子句,执行完后,再给每一条记录编号.
回到开头那个例子,SQL语句,应该写成如下:
SELECT bb.event_type,
SUM(CASE BB.id WHEN 1 THEN BB.[value] ELSE 0 END) -SUM(CASE BB.id WHEN 2 THEN BB.[value] ELSE 0 END) num1
FROM
(
SELECT row_number() over(partition by [event_type] order by [time] desc) as id,[event_type],[value],[time]
FROM [MaxMindDB].[dbo].[Test] a WHERE
EXISTS(SELECT 1 FROM ( SELECT count(*) AS num,[event_type] FROM [MaxMindDB].[dbo].[Test] GROUP BY [event_type]) AS AA WHERE AA.event_type=a.event_type AND AA.num>=2)
) BB GROUP BY BB.event_type
SQL中的row_number() over()解释的更多相关文章
- SQL中利用ROW_NUMBER()进行分页查询
SELECT ContractName ,ContractNO, State,CreateDate FROM (SELECT ContractName ,ContractNO,CreateDate, ...
- SQL中的JOIN类型解释(CROSS, INNER,OUTER),关键字ON,USING
书上讲得明白,解了不少迷惑. SELECT e.fname, e.lname, d.name FROM employee AS e INNER JOIN department AS d ON e.de ...
- sql 中如何取出指定行: Row_Number
原文:sql 中如何取出指定行: Row_Number ROW_NUMBER (Transact-SQL) USE AdventureWorks2008R2;GOWITH OrderedOrders ...
- 述 SQL 中的 distinct 和 row_number() over() 的区别及用法
1 前言 在咱们编写 SQL 语句操作数据库中的数据的时候,有可能会遇到一些不太爽的问题,例如对于同一字段拥有相同名称的记录,我们只需要显示一条,但实际上数据库中可能含有多条拥有相同名称的记录,从而在 ...
- 详述 SQL 中的 distinct 和 row_number() over() 的区别及用法
1 前言 在咱们编写 SQL 语句操作数据库中的数据的时候,有可能会遇到一些不太爽的问题,例如对于同一字段拥有相同名称的记录,我们只需要显示一条,但实际上数据库中可能含有多条拥有相同名称的记录,从而在 ...
- SQL中distinct 和 row_number() over() 的区别及用法
1 前言 在咱们编写 SQL 语句操作数据库中的数据的时候,有可能会遇到一些不太爽的问题,例如对于同一字段拥有相同名称的记录,我们只需要显示一条,但实际上数据库中可能含有多条拥有相同名称的记录,从而在 ...
- 深入具体解释SQL中的Null
NULL 在计算机和编程世界中表示的是未知,不确定.尽管中文翻译为 "空", 但此空(null)非彼空(empty). Null表示的是一种未知状态.未来状态,比方小明兜里有多少钱 ...
- sql中NVARCHAR(MAX) 性能和占空间分析 varchar(n),nvarchar(n) 长度性能及所占空间分析
varchar(n),nvarchar(n) 中的n怎么解释: nvarchar(n)最多能存n个字符,不区分中英文. varchar(n)最多能存n个字节,一个中文是两个字节. 所占空间: nvar ...
- ORACLE 中的 ROW_NUMBER() OVER() 分析函数的用法
ORACLE 中的 ROW_NUMBER() OVER() 分析函数的用法 ROW_NUMBER() OVER(partition by col1 order by col2) 表示根据col1分组, ...
随机推荐
- 可能是目前市面上唯一能够支持全平台的RTMP推流组件:Windows、Linux、Android、iOS、ARM
EasyRTMP是什么? EasyRTMP是一套RTMP直播推送功能组件,内部集成了包括:基本RTMP协议.断线重连.异步推送.环形缓冲区.推送网络拥塞自动丢帧.缓冲区关键帧检索.事件回调(断线.音视 ...
- history显示历史操作记录,并显示操作时间
在查看历史的操作记录有两种方式1.在用户的目录下的.bash_history文件中[root@node1 ~]# vi ~/.bash_history rebootvi /etc/sysconfig/ ...
- 爬虫前戏(回顾掌握) -- HTTP和HTTPS
一.HTTP协议 1.官方概念: HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web )服务器传输超文 ...
- Excel图表转成图片
关于excel 图表转成图片 知识点:excel 生成的图表不是图片 尝试. 通过Java调用POI接口挺难把excel生成的图表转成图片导出来 ps. 其它生成图表的工具,如jfre ...
- <再看TCP/IP第一卷>关于链路层的知识细节及相关协议
在TCP/IP协议族中,链路层的主要有三个目的: (1)为IP模块发送和接受数据报 (2)为ARP模块发送ARP请求和接受ARP应答 (3)为RARP发送RARP请求和接受RARP应答 TCP/IP支 ...
- java调用shell命令及脚本
shell脚本在处理文本及管理操作系统时强大且简单,将shell脚本结合到应用程序中则是一种快速实现的不错途径本文介绍使用java代码调用并执行shell 我在 -/bin/ 目录下写了jbossLo ...
- matlab写txt文件
fd=fopen('C:\Users\Qin\Desktop\1112.txt','w');for i=16:19 for j=1:5 fprintf(fd,'%f,%f\r\n',[cluster( ...
- BZOJ 1647 [Usaco2007 Open]Fliptile 翻格子游戏:部分枚举 位运算
题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=1647 题意: 在一个n*m(1 <= n,m <= 15)的棋盘上,每一个格子 ...
- Windows内存性能分析(二)性能瓶颈
内存瓶颈: 由于可用内存缺乏导致系统性能下降的现像. (一).相关的性能对象 主要考虑内存的页面操作和磁盘的I/O操作,需要考虑如下性能对象: Memory性能对象: 用于分析整个系统的内存瓶颈问题. ...
- Lucene默认的打分算法——ES默认
改变Lucene的打分模型 随着Apache Lucene 4.0版本在2012年的发布,这款伟大的全文检索工具包终于允许用户修改默认的基于TF/IDF原理的打分算法.Lucene API变得更加容易 ...