一、MySQL窗口函数

(1) 序号函数

row_number()在相等的两条记录上随机排序,但序号按照1、2递增,然后后面的序号继续递增为3,中间不会产生序号间隙;

rank()/dense_rank()则把前两条相等的记录序号都设置为1,但后续则分别设置为3(rank)和2(dense_rank)。即rank()会产生序号相同的记录,同时可能产生序号间隙;而dense_rank()也会产生序号相同的记录,但不会产生序号间隙。

(2) 分布函数

percent_rank()

  • 用途:和之前的RANK()函数相关,每行按照如下公式进行计算:
  • (rank - 1) / (rows - 1)
  • 其中,rank为RANK()函数产生的序号,rows为当前窗口的记录总行数
  • 应用场景:本行序号在该组内所占的位置百分比(很少用)。

cume_dist()

  • 用途:分组内小于等于当前rank值的行数/分组内总行数,这个函数比percen_rank使用场景更多。
  • 应用场景:大于等于当前订单金额的订单比例有多少

(3) 前后函数

前后函数——lead(n)/lag(n)。

  • 用途:分区中位于当前行前n行(lead)/后n行(lag)的记录值。
  • 使用场景:查询上一个订单距离当前订单的时间间隔。

SQL如下:

内层SQL先通过lag函数得到上一次订单的日期,外层SQL再将本次订单和上次订单日期做差得到时间间隔diff。

(4) 头尾函数

头尾函数——first_val(expr)/last_val(expr)。

  • 用途:得到分区中的第一个/最后一个指定参数的值。
  • 使用场景:查询截止到当前订单,按照日期排序第一个订单和最后一个订单的订单金额。

SQL如下:

结果和预期一致,比如order_id为4的记录,first_amount和last_amount分别记录了用户‘001’截止到时间2018-01-03 00:00:00为止,第一条订单金额100和最后一条订单金额800,注意这里是按时间排序的最早订单和最晚订单,并不是最小金额和最大金额订单。

(5) 其他函数

其他函数——nth_value(expr,n)/nfile(n)。

nth_value(expr,n)

  • 用途:返回窗口中第N个expr的值,expr可以是表达式,也可以是列名。
  • 应用场景:每个用户订单中显示本用户金额排名第二和第三的订单金额。

SQL如下:

nfile(n)

  • 用途:将分区中的有序数据分为n个桶,记录桶号。
  • 应用场景:将每个用户的订单按照订单金额分成3组。

SQL如下:

此函数在数据分析中应用较多,比如由于数据量大,需要将数据平均分配到N个并行的进程分别计算,此时就可以用NFILE(N)对数据进行分组,由于记录数不一定被N整除,所以数据不一定完全平均,然后将不同桶号的数据再分配。

(6) 聚合函数作为窗口函数

  • 用途:在窗口中每条记录动态应用聚合函数(sum/avg/max/min/count),可以动态计算在指定的窗口内的各种聚合函数值。
  • 应用场景:每个用户按照订单id,截止到当前的累计订单金额/平均订单金额/最大订单金额/最小订单金额/订单数是多少?

SQL如下:

除了这几个常用的聚合函数,还有一些也可以使用,比如BIT_AND()、STD()等等,具体查看官方文档。

 二、MySQL变量

MySQL入门 SQL语言之十八:系统变量(全局变量、会话变量),自定义变量(用户变量、局部变量)的使用
#变量
/*
系统变量:
    全局变量
    会话变量
自定义变量:
    用户变量
    局部变量
*/
#一、系统变量
/*
说明:变量由系统提供,不是用户定义,属于服务器层面
使用的语法:
1、查看所有的系统变量
show global variables;
SHOW session VARIABLES;#session可以省略

2、查看满足条件的部分系统变量
show VARIABLES variables like '%char%';

3、查看指定的某个系统变量值
select @@global|【session】.系统变量名;

4、为某个系统变量赋值
方式一:
set global|【session】 系统变量名 = 值;
set autocommit = 0;

方式二:
set @@global|【session】.系统变量名 = 值;

注意:
如果是全局级别,则需要加global,如果是会话级别,则需要加session,如果不写,则默认session

*/
#1》、全局变量
/*
作用域:服务器每次启动将为所有的全局变量赋初始值,针对于所有会话(连接)有效,但是不能跨重启。
如果要想每次启动也修改,则需要修改配置文件。
*/
#①查看所有的全局变量
SHOW GLOBAL VARIABLES;

#②查看部分的全局变量
SHOW GLOBAL VARIABLES LIKE '%char%';

#③查看指定的全局量的值
SELECT @@global.autocommit;
SELECT @@tx_isolation;

#④为某个指定全局变量赋值
#方式一:
SET @@global.autocommit = 0;
#方式二:
SET GLOBAL autocommit = 0;
#2》、会话变量
/*
作用域:仅仅针对于当前会话(连接)有效,并且有默认值
*/

#①查看所有的会话变量;
SHOW SESSION VARIABLES;
SHOW  VARIABLES;

#②查看部分的会话变量
SHOW  VARIABLES LIKE '%char%';
SHOW SESSION VARIABLES  LIKE '%char%';

#③查看指定的某个会话变量
SELECT @@tx_isolation;
SELECT @@session.tx_isolation;

#④为某个会话变量赋值
#方式一
SET @@session.tx_isolation = 'read-uncommitted';
#方式二:
SET SESSION tx_isolation =  'read-committed';

#二、自定义变量
/*
说明:变量是用户自定义的,不是由系统的

使用步骤
声明
赋值
使用(查看、比较、运算等)
*/
#1、用户变量
/*
作用域:针对于当前会话(连接)有效,同于会话变量的作用域
应用在任何地方,也就是begin end里面或begin end外边
*/
赋值的操作符: = 或 :=
#①声明并初始化
SET @用户变量名 = 值;
SET @用户变量名 := 值;
SELECT @用户变量名 :=值;

#②赋值(更新用户变量的值)
方式一: 通过SET或SELECT
    SET @用户变量名 = 值;
    SET @用户变量名 := 值;
    SELECT @用户变量名 :=值;
方式二:通过SELECT INTO
    SELECT 字段 INTO @变量名
    FROM 表;
#③使用(查看用户变量名的值)    
SELECT @用户变量名;

#2、局部变量
/*
作用域:仅仅在定义它的begin end中有效
应用在begin end中的第一句话
*/
#①声明
DECLARE 变量名 类型;
DECLARE 变量名 类型 DEFAULT 值;
#②赋值
方式一: 通过SET或SELECT
    SET 局部变量名 = 值;
    SET 局部变量名 := 值;
    SELECT @局部变量名 :=值;
方式二:通过SELECT INTO 局部变量名
    SELECT 字段
#③使用
SELECT 局部变量名;

#案例:
#声明并初始化
SET @name = 'john';
SET @name = 100;
SET @count = 1;
#赋值
SELECT COUNT(*) INTO @count 
FROM employees;
#查看
SELECT @count;

对比用户变量和局部变量

作用域 定义和使用的位置  语法
用户变量 当前的会话 会话中的任何地方 必须加@符号,不限定类型
局部变量  BEGIN END中 只能在BEGIN END中,且为第一句 一般不加@符号,需限定类型

#案例:声明两个变量并赋初始值,就和,并打印
#1.用户变量
SET @m=1;
SET @n=2;
SET @sum = @m+@n;
SELECT @sum;
#2.局部变量
    DECLARE m INT DEFAULT 1;
    DECLARE n INT DEFAULT 2;
    DECLARE SUM INT;
    SET SUM = m + n;
    SELECT SUM;

#报错

本文转载自:

http://www.sohu.com/a/260324504_411876

https://blog.csdn.net/qq_34626097/article/details/86528466;

使用MySQL会话变量实现窗口函数的更多相关文章

  1. dbcp/c3p0连接池设置mysql会话变量

    我们有几个计算风控值的定时任务,几乎每隔5秒会更新所有账户的当前总资产并以此通知风控,每隔一小时就产生一两个G的binlog,几十台服务器折腾..数据库是公用的,代码是通过工具自动生成的,直接修改流程 ...

  2. MYSQL进阶学习笔记一:MySQL编码设定,会话变量和全局变量!(视频序号:进阶_1-3)

    知识点一:MySQL编码设定(1-2) 服务器编码设定: 查看MySQL服务器端的编码格式: SHOW VARIABLES LIKE ‘char%’; 设定编码格式: SET NAMES ‘utf8’ ...

  3. MYSQL的全局变量和会话变量

    系统变量又分为全局变量与会话变量. 全局变量在MYSQL启动的时候由服务器自动将它们初始化为默认值,这些默认值可以通过更改my.ini这个文件来更改. 会话变量在每次建立一个新的连接的时候,由MYSQ ...

  4. MySQL 服务器变量 数据操作DML-视图

    原文:MySQL 服务器变量 数据操作DML-视图 SQL语言的组成部分 常见分类: DDL:数据定义语言 DCL:数据控制语言,如授权 DML:数据操作语言 其它分类: 完整性定义语言: DDL的一 ...

  5. MySQL中变量的总结

    本文对MySQL中局部变量.用户变量.系统变量的理解进行总结. 一.局部变量 局部变量由DECLARE语句声明: DECLARE var_name[,...] type [DEFAULT value] ...

  6. MySQL的变量分类总结

    在MySQL中,my.cnf是参数文件(Option Files),类似于ORACLE数据库中的spfile.pfile参数文件,照理说,参数文件my.cnf中的都是系统参数(这种称呼比较符合思维习惯 ...

  7. MySQL系统变量sql_safe_updates总结

    MySQL系统变量sql_safe_updates总结   在MySQL中,系统变量sql_safe_updates是个非常有意思的系统变量,在Oracle和SQL Server中都没有见过这样的参数 ...

  8. mysql之变量

    本文内容: 系统变量 用户变量 局部变量 首发日期:2018-04-18 系统变量: 系统变量就是系统已经提前定义好了的变量 系统变量一般都有其特殊意义.比如某些变量代表字符集.某些变量代表某些mys ...

  9. MySQL - 用户变量

    MySQL用户变量:基于会话变量实现的,可以暂存值,并传递给同一连接里的下一条sql使用的变量,当客户端连接退出时,变量会被释放. MySQL用户变量应用场景:同一连接,未关闭情况下,帮你暂存一些计算 ...

随机推荐

  1. Andriod Fragment 的作用和基本用法

    1.什么是Fragment: Fragment (片段)在Google Android 开发指南中的解释是:片段是Activity中的一部分,一个Activity中可以有多个Fragment.一个Fr ...

  2. day22_6-re模块

    # 参考资料:# python模块(转自Yuan先生) - 狂奔__蜗牛 - 博客园# https://www.cnblogs.com/guojintao/articles/9070485.html ...

  3. <Python基础>字典的基本操作

    ''' 小知识 1.字典的键只能是不可变数据类型:int 元组 bool str(可哈希) 字典查找数据会使用二分查找,会先用哈希表将键转化为数字然后进行查找 ''' s = { "name ...

  4. USACO 2007 February Silver The Cow Lexicon /// DP oj24258

    题目大意: 输入w,l: w是接下来的字典内的单词个数,l为目标字符串长度 输入目标字符串 接下来w行,输入字典内的各个单词 输出目标字符串最少删除多少个字母就能变成只由字典内的单词组成的字符串 Sa ...

  5. java_缓冲流(字节输入流)

    /** * java.iko.BufferedInputStream extends InputStream * BufferedInputStream:字节缓冲输入流 * 构造方法: * Buffe ...

  6. (转)nginx配置location总结及rewrite规则写法

    注: rewrite 只能对域名后边的除去传递的参数外的字符串起作用,并且要写全域名后面的部分,如: http://i.com:9090/php/midou/admin.php/index/login ...

  7. git sync tags with remote

    git 同步遠程標籤 在 .git/config的 [remote "origin"] 下加了 fetch = +refs/tags/*:refs/tags/* 最後就變成 [re ...

  8. 读《深入PHP 面向对象、模式与实践》笔记

    1. include() 和require() 语句的不同在于它们如何处理错误.使用require()调用文件发生错误时,将会停止整个程序;调用include()时遇到相同的错误,则会生成警告并停止执 ...

  9. configparser 配置文件模块

    #_author:star#date:2019/11/7# configparser 配置文件模块import configparserconfig=configparser.ConfigParser ...

  10. alias用于设置当前数据表的别名,

    alias用于设置当前数据表的别名,便于使用其他的连贯操作例如join方法等. 示例: $Model = M('User'); $Model->alias('a')->join('__DE ...