总结distinct、group by 、row_number()over函数用法及区别

distinct和group by 是一样的，查询去重，只能是全部重复的，也可以理解为针对单例，因为一行有一个字段不一样，他们就会认为这两行内容是不重复的。但是使用row_number()over这个函数就可以针对全部字段，完全重复还是部分重复都可以通过这个函数查找出来，因为它自身有分组的功能。以下就是具体代码：
- 上面那个表就是在最后两行时候ID,NAME，BIRTHDAY三个字段值重复，AGE字段值不一样。
- SELECT DISTINCT ID,NAME,BIRTHDAY FROM B查询结果就是：
- 但是语句上加上AGE字段，SELECT DISTINCT ID,NAME,BIRTHDAY，AGE FROM B 结果就不一样了：
- 会发现DISTINCT函数没有起作用，GROUP BY 函数和DISTINCT一样的，只是使用GROUP BY函数时候这样写就不会错：
  - SELECT ID,NAME,AGE,BIRTHDAY FROM B GROUP BY ID,NAME,AGE,BIRTHDAY;
- 换一种写法：SELECT ID,NAME,AGE,BIRTHDAY FROM B GROUP BY ID;就会报错，意思就是SELECT后面的跟几个字段，GROUP BY 后面也要跟几个字段，要不然就会报错。
说一说ROW_NUMBER()OVER这个函数：
- 删除一张表中重复数据，当你不知道那一个字段重复，或者你知道那一个字段重复，还有就是根据你的业务需求在用这个函数时候，因为这个函数在一定比较上还是有点麻烦，能不用就不用，但是呢这个函数内部有一个分组排序功能，也算是一种优化，像DISTINCT，不能随便用，成本高，效率低下，其实可以用group by 进行优化，其他的优化待续.......
- ROW_NUMBER()OVER
  - DELETE FROM (SELECT ID,ROW_NUMBER()OVER(PARTITION BY ID ORDER BY NAME)ROW_NUM FROM B)WHERE ROW_NUM>1;--这是删除表中全部重复部分重复的字段，根据业务需求。在你知道具体字段值重复时候直接delete from tablename where条件就可以删除。
- 使用ROW_NUMBER()OVER函数查询时候去重怎么操作：
  - select * from (select id,name,age,birthday, row_number() over (partition by id order by id)rank from b)where rank =1;
- 原来的表数据是这样的：
- 执行上面代码后结果是这样的：
- 使用row_number()over函数进行删除部分或者全部重复数据的代码是这样的：
  - delete from (select id,name,age,birthday, row_number() over (partition by id order by id)rank from b)where rank >1;
- 执行之前数据是这样的：
- 执行删除代码之后就是这样的：
- * 会这一个基本就行了，删除全部重复，部分重复，查询全部重复，查询部分重复均可用这一个。
- 其实个人对这个函数理解是：在查询时候，进行partition by 分组，order by 排序，然后把查询出来的结果集取个别名，可以把它当成一张表进行条件查询，别名rank就是分组之后那一列列名，新生的表包含rank这一个列，此时，就可以对这张分组排序好的表进行查询，最后查出来的结果就是去重的，无论全部重复或者部分重复均可使用。删除语句的道理和这个查询一模一样。

总结distinct、group by 、row_number()over函数用法及区别的更多相关文章

ROW_NUMBER() OVER()函数用法;(分组，排序），partition by
转载:https://www.cnblogs.com/alsf/p/6344197.html 1.row_number() over()排序功能: (1) row_number() over()分组排 ...
ROW_NUMBER() OVER()函数用法;(分组，排序），partition by (转)
1.row_number() over()排序功能: (1) row_number() over()分组排序功能: 在使用 row_number() over()函数时候,over()里头的分组以及排 ...
DB2中的ROW_NUMBER() OVER()函数用法
ROW_NUMBER() OVER()大概有俩方面的作用 1,分页, 并返回分页结果集.2,是对数据进行处理分组 db2的分页: select tmp.* from ( SELECT rownu ...
iOS中block的用法以及和函数用法的区别
ios中block的用法和函数的用法大致相同但是block的用法的灵活性更高: 不带参数的block: void ^(MyBlock)() = ^{}; 调用的时候 MyBlock(); 带参数的 ...
ruby gsub gsub! chomp chomp! 以及所有类似函数用法及区别
ruby中带“!"和不带"!"的方法的最大的区别就是带”!"的会改变调用对象本身了.比方说str.gsub(/a/, 'b'),不会改变str本身,只会返回一个 ...
C++虚函数与纯虚函数用法与区别（转载）
1. 虚函数和纯虚函数可以定义在同一个类(class)中,含有纯虚函数的类被称为抽象类(abstract class),而只含有虚函数的类(class)不能被称为抽象类(abstract class) ...
C++虚函数与纯虚函数用法与区别
1. 虚函数和纯虚函数可以定义在同一个类(class)中,含有纯虚函数的类被称为抽象类(abstract class),而只含有虚函数的类(class)不能被称为抽象类(abstract class) ...
Hive中笔记：三种去重方法，distinct,group by与ROW_Number()窗口函数
一.distinct,group by与ROW_Number()窗口函数使用方法 1. Distinct用法:对select 后面所有字段去重,并不能只对一列去重. (1)当distinct应用到多个 ...
ROW_NUMBER() OVER函数的基本用法用法
ROW_NUMBER() OVER函数的基本用法用法转自:http://www.cnblogs.com/icebutterfly/archive/2009/08/05/1539657.html 语法 ...

随机推荐

Code Forces 1030E
题目大意: 给你n个数,你可以交换一个数的任意二进制位,问你可以选出多少区间经过操作后异或和是0. 思路分析: 根据题目,很容易知道,对于每个数,我们可以无视它的1在那些位置,只要关注它有几个1即可, ...
线上服务的FGC问题排查
转载:https://blog.csdn.net/g6U8W7p06dCO99fQ3/article/details/106088467 线上服务的GC问题,是Java程序非常典型的一类问题,非常考验 ...
NB 的开源项目遍地开花——GitHub 热点速览 Vol.41
作者:HelloGitHub-小鱼干本周的 GitHub 热点速览的关键词便是 nb,也是本周特推之一的项目名字,这个功能如名字一般 nb 的项目是一个脚本,帮你处理笔记.书签.归档和知识库应用程序 ...
Jersey实现跨服务器上传图片：UniformInterfaceException：403 Forbidden
jersey.api.client.UniformInterfaceException :returned a response status of 403 Forbidden 图片服务器:端口808 ...
多测师讲解自动化测试 _RF自定义关键字_高级讲师肖sir
RF自定义关键字在rf中叫关键字在python中就叫做函数或实例方法我们自己可以写自定义关键字自己创建一个库===库里面去创建模块===模块里面创建类和实例方法==>rf导入和引用库 ...
keccak和sha3的区别
keccak应用在以太坊中,用keccak哈希算法来计算公钥的256位哈希,再截取这256位哈希的后160位哈希作为地址值. keccak和sha3的区别 sha3由keccak标准化而来,在很多场 ...
MySQL数据库规范 (设计规范+设计规范+操作规范)
I 文档定义 1.1 编写目的为了在软件生命周期内规范数据库相关的需求分析.设计.开发.测试.运维工作,便于不同团队之间的沟通协调,以及在相关规范上达成共识,提升相关环节的工作效率和系统的可维护性. ...
第十二章 LNMP架构之分离数据库
一.课程回顾 1.搭建LNMP环境 1.配置官方源2.yum安装依赖3.yum安装nginx4.配置nginx5.创建用户6.启动并加入开机自启7.上传安装包8.解压安装包9.卸载旧版本PHP10. ...
五分钟详解MySQL并发控制及事务原理
在如今互联网业务中使用范围最广的数据库无疑还是关系型数据库MySQL,之所以用"还是"这个词,是因为最近几年国内数据库领域也取得了一些长足进步,例如以TIDB.OceanBase等 ...
《Kafka笔记》3、Kafka高级API
目录 1 Kafka高级API特性 1.1 Offset的自动控制 1.1.1 消费者offset初始策略 1.1.2 消费者offset自动提交策略 1.2 Acks & Retries(应 ...

总结distinct、group by 、row_number()over函数用法及区别

总结distinct、group by 、row_number()over函数用法及区别的更多相关文章

随机推荐

热门专题