数据库环境:SQL SERVER 2008R2

Sql Server有提供求集合差集的函数——EXCEPT。先看看EXCEPT的用法,

  1. { <query_specification> | ( <query_expression> ) }
  2. { EXCEPT }
  3. { <query_specification> | ( <query_expression> ) }
  4.  
  5. EXCEPT 操作数左边的查询中返回右边的查询未返回的所有非重复值。
    上面是摘自MSDNEXCEPT函数的用法介绍。
  6.  
  7. 在这里,我们的要求有点特别,集合B中存在多少条集合A的记录,那么,在集合A中剔除集合B中对应的记录条数。
    假如A表有数据如下:
    id    name
    1     a
    1     a
    2     b
  8.  
  9. B表数据如下:
    id    name
    1     a
    3     c
  10.  
  11. 根据需求,B表中有一条记录和A表有重复,因此,在A表中,把该重复记录的一条去掉,
    结果数据如下:
    id    name
    1     a
    2     b
    需求已经清晰了,现在开始来实现实现的方法是:分别给a表和b表的重复记录编号,
    只要在b表中存在和a表编号、idname一样的记录,即在a表进行过滤。
    先准备基础数据
  1. WITH a
  2. AS ( SELECT 1 AS id ,
  3. 'a' AS NAME
  4. UNION ALL
  5. SELECT 1 AS id ,
  6. 'a' AS NAME
  7. UNION ALL
  8. SELECT 2 AS id ,
  9. 'b' AS NAME
  10. UNION ALL
  11. SELECT 3 AS id ,
  12. 'c' AS NAME
  13. UNION ALL
  14. SELECT 3 AS id ,
  15. 'c' AS NAME
  16. UNION ALL
  17. SELECT 1 AS id ,
  18. 'a' AS NAME
  19. UNION ALL
  20. SELECT 4 AS id ,
  21. 'd' AS NAME
  22. ),
  23. b
  24. AS ( SELECT 3 AS id ,
  25. 'c' AS NAME
  26. UNION ALL
  27. SELECT 1 AS id ,
  28. 'a' AS NAME
  29. UNION ALL
  30. SELECT 2 AS id ,
  31. 'b' AS NAME
  32. UNION ALL
  33. SELECT 3 AS id ,
  34. 'c' AS NAME
  35. UNION ALL
  36. SELECT 1 AS id ,
  37. 'a' AS NAME
  38. )
  1.  

分别来看一下a表和b表的数据

      

第一种方式,用NOT EXISTS来实现

  1. SELECT id ,
  2. NAME
  3. FROM ( SELECT id ,
  4. ROW_NUMBER() OVER ( PARTITION BY id, NAME ORDER BY id ) AS nid ,
  5. NAME
  6. FROM a
  7. ) a
  8. WHERE NOT EXISTS ( SELECT NULL
  9. FROM ( SELECT id ,
  10. ROW_NUMBER() OVER ( PARTITION BY id,
  11. NAME ORDER BY id ) AS nid ,
  12. NAME
  13. FROM b
  14. ) b
  15. WHERE b.nid = a.nid
  16. AND b.id = a.id
  17. AND b.NAME = a.NAME )

第二种实现方式,通过EXCEPT来实现

  1. SELECT id ,
  2. NAME
  3. FROM ( SELECT id ,
  4. ROW_NUMBER() OVER ( PARTITION BY id, NAME ORDER BY id ) AS nid ,
  5. NAME
  6. FROM a
  7. EXCEPT
  8. SELECT id ,
  9. ROW_NUMBER() OVER ( PARTITION BY id, NAME ORDER BY id ) AS nid ,
  10. NAME
  11. FROM b
  12. ) a

方法1和方法2本质上是一样的思路,只不过写法不同而已。

我们来看下结果

aaarticlea/png;base64,iVBORw0KGgoAAAANSUhEUgAAAFUAAABGCAIAAAAy1U84AAAC10lEQVR4nO2YsY6cMBCG551QCvMu0SmF/SB5AIvW3Rana0IqSzxEQEqLRJ27bU5i0y6SU3gXbDBwp5hZkP3LugUDN/78D2AGlFflef5mS4iqLEshKlHd2un0rJRSLFEsKcsyYYkQVZKwN5cAwLk96tEboxOcnXmet4bAO/+rLSGqhLGnp6eEMd00/8uvVlSVEJUQ1en0nCTsdU0AMNrVPWY/2Jpehc0/laadttULvWhz/j/71ub8x5Jn/sMJfvyUITfouu58uXa4wo84p8gf+SP/2mhqTgiv/UV1RKw5ASPGKKKkMDoKAFRa+/q4PmRoOMslF/+UFonfYLQjSgqU0qGj5oQQYp4MBv9nhron/wnn9G6XFbHmhMpOUnt2eL8vKaGUeOPv/4WZSyj8tRnapKXS6tKb9wmRlHDpuvADWuCvObm7ISkSv071CawextBnTZako4n7xO2/wD9yAIu/G/GMgCyTa06o1BPmTJwPaIf8Xc2JdT9bz3nCa/uX2DfHFvk/ejf9v5b59esOLNLJ0IZsp7LbhN9IPfNl40Nr/P2MTx48GnjhDT15/y8PPK7/In/kD5j/fLmG3OBWBgVA/rsTQdd1bdue3/9iNoBd1F0HfgDA5G/b9tHsSpn80f/o/2zLv8K3lyD9//39i15Ee+aP/h/D/6345/wv2PDdxgpE/t3532RpmjVo/DvxXzVZ2icAJv8+/C9YDx2k/wXr73pjKjD49+G/lf6o/HH9hwe/4D+yov/R//PlGrT/QyUoyBLYLf/xJx45olORP/JH/nV+74vxdX7k75+VofhejB+Iv8nSlDHPgzkOf8GAFd4HMxvxUfWPmRNuH+RY/E2W3gsAyN//zsM9NhK/GWYH+W8VI/zm4yH43QPzFXgmzi3/myx9fP6b48J+/qXpjvzfIjByRKcif+QPnV/Xv/ADI0d0qjXrXwFKKbWLOuwDFfnDVuQPW6Hz/wMYmZJZV6QB7wAAAABJRU5ErkJggg==" alt="" />

(本文完)

  1.  

SQL求差集的更多相关文章

  1. hiveQL求差集

    hive sql求差集的方法 1.什么是差集 set1 - set2,即去掉set1中存在于set2中的数据. 2.hive中计算差集的方法,基本是使用左外链接. 直接上代码 select * fro ...

  2. 3亿(int)数据-2亿(int)数据 求差集

    两个大文本,每行一条int数据 3亿(int)数据-2亿(int)数据 求差集 原始(粗暴)办法 1redis set 或类似方案 本地内存 cpu都撑不住 2持久化两张表 sql join mysq ...

  3. Silverlight项目笔记6:Linq求差集、交集&检查网络连接状态&重载构造函数复用窗口

    1.使用Linq求差集.交集 使用场景: 需要从数据中心获得用户数据,并以此为标准,同步系统的用户信息,对系统中多余的用户进行删除操作,缺失的用户进行添加操作,对信息更新了的用户进行编辑操作更新. 所 ...

  4. 用SQL求1到N的质数和

    今天在百度知道中,遇到了一位朋友求助:利用sql求1到1000的质数和.再说今天周五下午比较悠闲,我就在MSSQL 2008中写了出来,现在分享在博客中,下面直接贴代码: declare @num i ...

  5. java8 集合求差集、并集、交集

    前言 java8里最大亮点是lambda,让我们用习惯C# linq的语法,也能眼前一亮.但是比起C#的语法糖还是差的很远. 差集.并集.交集 @Test public void test1(){ L ...

  6. 关于数组array_diff(array1, array2)求差集来比较数组是否相等的问题细究

    无意中发现很多朋友都喜欢使用array_diff(array1, array2)来判断两个数组是否相等, 我自己也偶尔会这么使用 但是今天我在写代码的过程中无意发现这么做是不准确的. 首先我们来看一下 ...

  7. List<model>需要根据特定字段求差集的实现

    list对象不能直接使用Except等封装好的函数,因为内存地址不一样(还有一些数虽然主数据一致但是update/create信息也不一致,对,我碰到的需求就是这么难受 TOT) 这时候我们的需求很多 ...

  8. python中列表之间求差集、交集、并集

    求两个列表的交集.并集.差集 def diff(listA, listB): # 求交集的两种方式 retA = [i for i in listA if i in listB] retB = lis ...

  9. Python求差集

    本月月初在职员工表(20来列,身份证.银行卡号等),本月离职员工表(10来列,计时.计件等),不考虑本月入职员工表,求下月月初在职员工表. Python,import pandas as pd,两个p ...

随机推荐

  1. 【转】Android bluetooth介绍(三): 蓝牙扫描(scan)设备分析

    原文网址:http://blog.csdn.net/xubin341719/article/details/38584469 关键词:蓝牙blueZ  A2DP.SINK.sink_connect.s ...

  2. devi into python 笔记(七)locals与globals 字典格式化字符串 字符集

    locals()与globals(): """ locals:局部命名空间 globals:全局命名空间 都是以dictionary的形式保存的,变量名是键,变量值是值 ...

  3. 树的最大深度 leecode java

    秒杀/** * Definition for binary tree * public class TreeNode { * int val; * TreeNode left; * TreeNode ...

  4. GCC基本知识

    掌握下面的对GCC会有一个比较清晰的大致的了解: 不经意间,GCC已发展到了4.3的版本,尽管在软件开发社区之外乏人闻问,但因为GCC在几乎所有开源软件和自由软件中都会用到,因此它的编译性能的涨落会直 ...

  5. OSI 七层模型和 TCP/IP 协议比较

      OSI (Open System Interconnection), 开放式系统互联参考模型.从下到上七层模型功能及其代表协议: 物理层(Physical) :规定了激活.维持.关闭通信端点之间的 ...

  6. 武汉Uber优步司机奖励政策(2月1日~2月7日)

    滴快车单单2.5倍,注册地址:http://www.udache.com/ 如何注册Uber司机(全国版最新最详细注册流程)/月入2万/不用抢单:http://www.cnblogs.com/mfry ...

  7. 几款开源的图形化Redis客户端管理软件推荐

    Redis是一个超精简的基于内存的键值对数据库(key-value),一般对并发有一定要求的应用都用其储存session,乃至整个数据库.不过它公自带一个最小化的命令行式的数据库管理工具,有时侯使用起 ...

  8. Maven浅析-3 Ant Vs Maven

    1.什么是Ant? Ant起源是为了取代构建工具Make.它可以跨系统,建立在Java和XML的基础上,而且非常程式化. Ant更像一个脚本工具,我们必须在Ant内显示地声明做任何事情.在<ta ...

  9. 【python自动化第七篇:面向对象进阶】

    知识点概览: 静态方法,类方法,属性方法 类的特殊方法 反射 异常处理 socket开发基础 一.静态方法:@staticmethod 只是名义上归类管理,实际上在静态方法里访问不了类或者实例中的任何 ...

  10. javascript朝花夕拾

    (一)javascript中的数组index属性——获取数组的索引值 例如:要做到这样的效果 点击每个选项时,会显示不同的div. 我们的做法:在javascript中,先把所有的div的displa ...