【daily】sql分组,每组取N条
数据准备
-- mysql语法
DROP TABLE IF EXISTS `test_group_type`;
CREATE TABLE `test_group_type` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`type` int(255) NOT NULL COMMENT '分类',
`sortno` int(11) NOT NULL DEFAULT '1' COMMENT '分类排序',
PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=11 DEFAULT CHARSET=utf8;
INSERT INTO `test_group_type` VALUES ('1', '1', '1');
INSERT INTO `test_group_type` VALUES ('2', '2', '1');
INSERT INTO `test_group_type` VALUES ('3', '2', '2');
INSERT INTO `test_group_type` VALUES ('4', '3', '1');
INSERT INTO `test_group_type` VALUES ('5', '3', '2');
INSERT INTO `test_group_type` VALUES ('6', '3', '3');
INSERT INTO `test_group_type` VALUES ('7', '4', '4');
INSERT INTO `test_group_type` VALUES ('8', '4', '3');
INSERT INTO `test_group_type` VALUES ('9', '4', '1');
INSERT INTO `test_group_type` VALUES ('10', '4', '2');
需求说明
取每个分类的前3条数据。
实现
SELECT * from test_group_type p
where (select count(1) from test_group_type r where r.type = p.type and r.id < p.id) < 3
ORDER BY p.type, p.id
r.id < p.id 或 r.id > p.id
, 区别是: 取前, 还是取后。
r.id < p.id
结果:
r.id > p.id
结果:
sql解释:
核心是select count(1) from test_group_type r where r.type = p.type and r.id < p.id
。
首先, 理解select count(1) from test_group_type r where r.type = p.type
, 统计与当前行类型相同的一共有多少行。
然后r.id < p.id
, 只统计当前行之前的数据(因为表结构的id是自增)。
比如id=7
, 实际就是 select count(1) from test_group_type r where r.type = 4 and r.id < 7
, 结果是0
, 并且0 < 3, true
。
所以id=7
的行被选中。
类推,id=10
, 结果是3 < 3, false
, 所以不满足。
扩展
以上是建立在id
有序自增长的基础上,如果想要自定义排序要怎么写?
如果理解了前面的sql, 那么只需要改变count
的筛选。
比如,取type=4
根据sortno
排序的前3条。
SELECT * from test_group_type p
where p.type = 4
and (select count(1) from test_group_type r where r.type = p.type and r.sortno < p.sortno) < 3
ORDER BY p.type, p.id
结果:
r.sortno < p.sortno: r.sortno > p.sortno:
方式二 (2017-11-28): mysql动态sql实现 特别: 并未测试大量数据下的性能, 但感觉效率不高
上面方式如果是根据sortno排序有bug. 比如数据结构如下:
取每组前4条,排序规则order by sortno, id
. 理想结果是(type=4): 11, 3, 7, 8
如果用方式一
得到的结果: (因为sortno存在相同, 且sortno不足4条)
于是另外一种方式是: 利用动态sql先对每行数据进行组内排序, 再取rownum <= 4
SELECT t1.*
, case when @type = t1.type then @row:=@row+1 else @row:=1 END rownum
, @type:=t1.type rowtype
from test_group_type t1
ORDER BY t1.type, t1.sortno, t1.id
结果:
sql解释:
1、首先要明确sql执行顺序select * from
的*
是最后执行的;
2、所以以上sql在order by
后, 再追加组内排序号rownum
。
@type
是变量, @type:=t1.type
即把每行的type赋值给变量。
当@type
不等于当前行type
时(即改行是该type的第一行),所以rownum=1
;
当@type
等于当前行type
时,rownum
递增;
-- 完整sql
SELECT tt.id, tt.type, tt.sortno from(
SELECT t1.*
, case when @type = t1.type then @row:=@row+1 else @row:=1 END rownum
, @type:=t1.type rowtype
from test_group_type t1
ORDER BY t1.type, t1.sortno, t1.id
) tt where tt.rownum <= 4;
【daily】sql分组,每组取N条的更多相关文章
- SQL分组排序后取每组最新一条数据的另一种思路
在hibernate框架和mysql.oracle两种数据库兼容的项目中实现查询每个id最新更新的一条数据. 之前工作中一直用的mybatis+oracle数据库这种,一般写这类分组排序取每组最新一条 ...
- SQL语句:随机取3条不重复的记录
随机取3条不重复的记录 [Access]select top 3 * from tablename order by rnd(id); [SqlServer]select top 3 * from t ...
- sql 分组后 组内排名
语法:ROW_NUMBER() OVER(PARTITION BY COLUMN ORDER BY COLUMN) 简单的说row_number()从1开始,为每一条分组记录返回一个数字,这里的ROW ...
- sql语句实现随机取n条数据(转)
我想把数组打乱随机取些值,于是用PHP的shuffl()打乱数组,当然,array_rand()也是可以随机取数组的,但是我想到另一个更高效的办法,是不是能用sql直接随机数据?当然可以! mysql ...
- SQL 查询每组的第一条记录
CREATE TABLE [dbo].[test1]( [program_id] [int] NULL, [person_id] [int] NULL ) ON [PRIMARY] /*查询每组分组中 ...
- sql重复数据只取一条记录
1.SQL SELECT DISTINCT 语句 在表中,可能会包含重复值.这并不成问题,不过,仅仅列出不同(distinct)的值. 关键词 DISTINCT 用于返回唯一不同的值. 语法: SEL ...
- SQL 分组获取产品 前两条记录
select * from ( select *, ROW_NUMBER() over(partition by IPAddress order by recordtime desc) as rowN ...
- sql 分组取每组的前n条或每组的n%(百分之n)的数据
sql 分组取每组的前n条或每组的n%(百分之n)的数据 sql keyword: SELECT * ,ROW_NUMBER() OVER(partition by b.UserID order by ...
- 记一次有意思的 SQL 实现 → 分组后取每组的第一条记录
开心一刻 今天,朋友气冲冲的走到我面前 朋友:我不是谈了个女朋友,谈了三个月嘛,昨天我偷看她手机,你猜她给我备注什么 我:备注什么? 朋友:舔狗 2 号! 我一听,气就上来了,说道:走,找她去,这婆娘 ...
随机推荐
- [SDOI2011]染色(树链剖分)
[SDOI2011]染色(luogu) Description 给定一棵有n个节点的无根树和m个操作,操作有2类: 1.将节点a到节点b路径上所有点都染成颜色c: 2.询问节点a到节点b路径上的颜色段 ...
- python基础面试集锦(51-100)
目录 51.把aaabbbcccdd这种形式的字符串压缩成a3b3c3d2的形式? 52.给你一个字符串'abc',打印出该字符串的所有排列组合? 53.执行以下代码后,x的值为? 54.对于一个非空 ...
- vue项目使用keep-alive
作用: 在vue项目中,难免会有列表页面或者搜索结果列表页面,点击某个结果之后,返回回来时,如果不对结果页面进行缓存,那么返回列表页面的时候会回到初始状态,但是我们想要的结果是返回时这个页面还是之前搜 ...
- Maven - 配置管理
Maven Maven是一款自动化构建工具,专注服务于Java平台的项目构建和依赖管理.Project Object Model:项目对象模型.将Java工程的相关信息封装为对象形式作为便于操作和管理 ...
- Spring注入bean的方式
在Spring容器中为一个bean配置依赖注入有三种方式: · 使用属性的setter方法注入 这是最常用的方式: · 使用构造器注入: · 使用Filed注入(用于注解方式). 使用属性的se ...
- HYSBZ_1854_并查集
http://www.lydsy.com/JudgeOnline/problem.php?id=1854 每次判断每组两个数的根,若不等,则小的遍历1,大的为根,若相等,则说明前面的小的都遍历过,根遍 ...
- DHCP服务器配置及测试
1 DHCP服务器简介 DHCP(Dynamic Host Configuration Protocol),动态主机配置协议,DHCP 协议主要是用来自动为局域网中的客户机分配TCP/IP 信息的网络 ...
- ARTS Week 12
Jan 13, 2020 ~ Jan 19, 2020 Algorithm Problem 112. Path Sum (路径总和) 题目链接 题目描述:给定一棵二叉树和一个值 sum ,检查二叉树是 ...
- Net Core 中WebAPI有关 Session的设置,及获取
步骤一: 在Startup 文件中做相应的设置 ConfigureServices方法里添加 //ConfigureServices添加: services.AddSession(options =& ...
- 编写 Django 应用单元测试
作者:HelloGitHub-追梦人物 文中所涉及的示例代码,已同步更新到 HelloGitHub-Team 仓库 我们博客功能越来越来完善了,但这也带来了一个问题,我们不敢轻易地修改已有功能的代码了 ...