• distinct和group by 是一样的,查询去重,只能是全部重复的,也可以理解为针对单例,因为一行有一个字段不一样,他们就会认为这两行内容是不重复的。但是使用row_number()over这个函数就可以针对全部字段,完全重复还是部分重复都可以通过这个函数查找出来,因为它自身有分组的功能。以下就是具体代码:

      • 06e9905b46944b763525d0c48b8f8cfe.png
      • 上面那个表就是在最后两行时候ID,NAME,BIRTHDAY三个字段值重复,AGE字段值不一样。
      • SELECT DISTINCT ID,NAME,BIRTHDAY FROM B查询结果就是:
      • 1aff0fb8a27c0842d36db613f000dcb9.png
      • 但是语句上加上AGE字段,SELECT DISTINCT ID,NAME,BIRTHDAY,AGE FROM B 结果就不一样了:
      • cc083ab734916f8bb2425aea68f1c7ed.png
      • 会发现DISTINCT函数没有起作用,GROUP BY 函数和DISTINCT一样的,只是使用GROUP BY函数时候这样写就不会错:
        • SELECT ID,NAME,AGE,BIRTHDAY FROM B GROUP BY ID,NAME,AGE,BIRTHDAY;
      • 换一种写法:SELECT ID,NAME,AGE,BIRTHDAY FROM B GROUP BY ID;就会报错,意思就是SELECT后面的跟几个字段,GROUP BY 后面也要跟几个字段,要不然就会报错。
    • 说一说ROW_NUMBER()OVER这个函数:

      • 删除一张表中重复数据,当你不知道那一个字段重复,或者你知道那一个字段重复,还有就是根据你的业务需求在用这个函数时候,因为这个函数在一定比较上还是有点麻烦,能不用就不用,但是呢这个函数内部有一个分组排序功能,也算是一种优化,像DISTINCT,不能随便用,成本高,效率低下,其实可以用group by 进行优化,其他的优化待续.......

      • ROW_NUMBER()OVER

        • DELETE FROM (SELECT ID,ROW_NUMBER()OVER(PARTITION BY ID ORDER BY NAME)ROW_NUM FROM B)WHERE ROW_NUM>1;--这是删除表中全部重复部分重复的字段,根据业务需求。在你知道具体字段值重复时候直接delete from tablename where条件就可以删除。
      • 使用ROW_NUMBER()OVER函数查询时候去重怎么操作:

        • select * from (select id,name,age,birthday, row_number() over (partition by id order by id)rank from b)where rank =1;
      • 原来的表数据是这样的:

      • ee48da82d2895528c1a88e46cfd4c5c6.png

      • 执行上面代码后结果是这样的:

      • d8ca693c2a00ca7532251f81a5c60653.png

      • 使用row_number()over函数进行删除部分或者全部重复数据的代码是这样的:

        • delete from (select id,name,age,birthday, row_number() over (partition by id order by id)rank from b)where rank >1;
      • 执行之前数据是这样的:

      • 5bd0811d0b2dffcdb082392aee8fd443.png

      • 执行删除代码之后就是这样的:

      • 193e3c3dfe0592ab8df2a67f1dccbbba.png* 会这一个基本就行了,删除全部重复,部分重复,查询全部重复,查询部分重复均可用这一个。

      • 其实个人对这个函数理解是:在查询时候,进行partition by 分组,order by 排序,然后把查询出来的结果集取个别名,可以把它当成一张表进行条件查询,别名rank就是分组之后那一列列名,新生的表包含rank这一个列,此时,就可以对这张分组排序好的表进行查询,最后查出来的结果就是去重的,无论全部重复或者部分重复均可使用。删除语句的道理和这个查询一模一样。

总结distinct、group by 、row_number()over函数用法及区别的更多相关文章

  1. ROW_NUMBER() OVER()函数用法;(分组,排序),partition by

    转载:https://www.cnblogs.com/alsf/p/6344197.html 1.row_number() over()排序功能: (1) row_number() over()分组排 ...

  2. ROW_NUMBER() OVER()函数用法;(分组,排序),partition by (转)

    1.row_number() over()排序功能: (1) row_number() over()分组排序功能: 在使用 row_number() over()函数时候,over()里头的分组以及排 ...

  3. DB2中的ROW_NUMBER() OVER()函数用法

      ROW_NUMBER() OVER()大概有俩方面的作用 1,分页, 并返回分页结果集.2,是对数据进行处理 分组 db2的分页: select tmp.* from ( SELECT rownu ...

  4. iOS中block的用法 以及和函数用法的区别

    ios中block的用法和函数的用法大致相同 但是block的用法的灵活性更高: 不带参数的block: void ^(MyBlock)() = ^{}; 调用的时候  MyBlock(); 带参数的 ...

  5. ruby gsub gsub! chomp chomp! 以及所有类似函数用法及区别

    ruby中带“!"和不带"!"的方法的最大的区别就是带”!"的会改变调用对象本身了.比方说str.gsub(/a/, 'b'),不会改变str本身,只会返回一个 ...

  6. C++虚函数与纯虚函数用法与区别(转载)

    1. 虚函数和纯虚函数可以定义在同一个类(class)中,含有纯虚函数的类被称为抽象类(abstract class),而只含有虚函数的类(class)不能被称为抽象类(abstract class) ...

  7. C++虚函数与纯虚函数用法与区别

    1. 虚函数和纯虚函数可以定义在同一个类(class)中,含有纯虚函数的类被称为抽象类(abstract class),而只含有虚函数的类(class)不能被称为抽象类(abstract class) ...

  8. Hive中笔记 :三种去重方法,distinct,group by与ROW_Number()窗口函数

    一.distinct,group by与ROW_Number()窗口函数使用方法 1. Distinct用法:对select 后面所有字段去重,并不能只对一列去重. (1)当distinct应用到多个 ...

  9. ROW_NUMBER() OVER函数的基本用法用法

    ROW_NUMBER() OVER函数的基本用法用法 转自:http://www.cnblogs.com/icebutterfly/archive/2009/08/05/1539657.html 语法 ...

随机推荐

  1. Varnish 不重启使之配置生效的方法

    Varnish 在内存模式下比较高效,不过它有一个缺点就是 缓存是放在内存里的,一旦重启, 缓存文件也就没了. 往往由于需要调整 vcl 配置文件,但是又不想重启varnish服务,就让配置文件生效的 ...

  2. node_modules 文件夹需要管理员权限才能删除问题

    方法一:以管理员权限运行IDE ,然后在IDE里面删除该文件夹 方法二:以管理员身份运行cmd,使用命令行来删除该文件夹 找到要删除文件夹的位置,使用命令行 rmdir /s/q 文件夹位置 /s 是 ...

  3. 利用HDFS实现ElasticSearch7.2容灾方案

    利用HDFS实现ElasticSearch7.2容灾方案 目录 利用HDFS实现ElasticSearch7.2容灾方案 前言 快照版本兼容 备份集群 HDFS文件系统 软件下载 JDK环境 配置系统 ...

  4. 多测师讲解自动化测试 _接口面试题(001)_高级讲师肖sir

    1.为什么要做接口测试(必要性)1.可以发现很多在页面上操作发现不了的bug2.检查系统的异常处理能力3.检查系统的安全性.稳定性4.前端随便变,接口测好了,后端不用变5.可以测试并发情况,一个账号, ...

  5. MarkDown语法记录,还在用word,txt编写项目文档吗?

    开始之前 是不是在github上看项目的时候第一眼就要看项目介绍? 是不是经常在某些项目的代码里面看到一个README.MD文档 却不知道怎么写? 你是不是不知道,反正我是的. 作为一个程序员,可能写 ...

  6. day10 Pyhton学习

    一.昨日内容回顾 函数: 定义:对功能或者动作的封装 def 函数名(形参): 函数体 函数名(实参) return:  返回,当程序运行到return的时候,终止函数的执行 一个函数一定拥有返回值 ...

  7. day09 Pyhton学习

    一.昨日内容回顾 文件操作 open(文件路径,mode="模式",encoding="编码") 文件路径: 1.绝对路径 从磁盘根目录寻找 2.相对路径 相对 ...

  8. hugo官方相关文档地址

    +++ date="2020-10-17" title="hugo官方相关文档地址" tags=["hugo"] categories=[& ...

  9. linux(centos8):为prometheus安装grafana(grafana-7.0.3)

    一,grafana的用途 1,grafana是什么? grafana 是用 go 语言编写的开源应用, 它的主要用途是大规模指标数据的可视化展现 它是现在网络架构/应用分析中最流行的时序数据展示工具 ...

  10. swoole执行外部程序称为进程

    <?php $child = new \Swoole\Process(function(\Swoole\Process $process){ $process->exec('/usr/lo ...