在编写SQL脚本中,多表连接查询操作需要使用到on和where条件,但是经常会混淆两者的用法,从而造成取数错误。为此,使用测试数据进行总结如下:

1、现有两张测试表,table_a和table_b。
table_a表中的数据:14条记录,主键是(user_id,brand_id),是用户在每个月份访问的上网品牌及其访问频率。
table_b表中的数据:主键是user_id,是用户基本类别表,Type_Id是用户在该月份的用户类别。
 
(1)通过user_id和month_id连接起来的效果:
 SELECT A1.User_Id
,A1.Month_Id
,A1.Brand_Id
,A1.Rate
,A2.User_Id
,A2.Month_Id
,A2.Type_Id
FROM table_a A1
LEFT JOIN table_b A2
ON A1.User_Id=A2.User_Id
AND A1.Month_Id=A2.Month_Id
;

最终的记录数等于主表的记录数。

主表的选择很重要,这里的记录数等于主表记录数,但不是总是这样的,与非主表中的记录组成也有关系。
(2)添加where条件的效果:
 SELECT A1.User_Id
,A1.Month_Id
,A1.Brand_Id
,A1.Rate
,A2.User_Id
,A2.Month_Id
,A2.Type_Id
FROM table_a A1
LEFT JOIN table_b A2
ON A1.User_Id=A2.User_Id
AND A1.Month_Id=A2.Month_Id
WHERE A1.Brand_Id='501B03'
;

说明where条件是对连接完成产生的查询结果的再次筛选。会影响到最后的记录数。
(3)继续添加where条件的效果:
 SELECT A1.User_Id
,A1.Month_Id
,A1.Brand_Id
,A1.Rate
,A2.User_Id
,A2.Month_Id
,A2.Type_Id
FROM table_a A1
LEFT JOIN table_b A2
ON A1.User_Id=A2.User_Id
AND A1.Month_Id=A2.Month_Id
WHERE A1.Brand_Id='501B03'
AND A2.Type_Id=10
;

进一步说明,where条件是对连接产生的查询结果集的二次筛选。

(4)添加更多个on连接条件的效果:
 SELECT A1.User_Id
,A1.Month_Id
,A1.Brand_Id
,A1.Rate
,A2.User_Id
,A2.Month_Id
,A2.Type_Id
FROM table_a A1
LEFT JOIN table_b A2
ON A1.User_Id=A2.User_Id
AND A1.Month_Id=A2.Month_Id
AND A1.Brand_Id='501B03'
;
总结如下:这里是对主表添加了On条件,它会对主表参与多表连接的记录进行一次过滤,只有满足这个条件的主表记录才会参与与其他表的连接操作,获取其他表中的字段组成一条需要的记录;主表中不符合这个on条件的记录也会进入到最后的结果表中,但不会参与与其他表的连接,因此,记录中其他表中获取的字段处全是NULL。
这里可以体现出,主表的特殊性,在left join 里面,主表就是多表连接最左边的那张表,表里面所有的记录都会出现在最后的结果集中,但是只有满足on条件的记录才会参与与其他表的连接操作。
 SELECT A1.User_Id
,A1.Month_Id
,A1.Brand_Id
,A1.Rate
,A2.User_Id
,A2.Month_Id
,A2.Type_Id
FROM table_a A1
LEFT JOIN table_b A2
ON A1.User_Id=A2.User_Id
AND A1.Month_Id=A2.Month_Id
AND A2.Type_Id=10
;


总结如下:这里添加了对被连接表的On条件,这个条件也不会影响主表在最后结果集中的记录,它的作用主要是对被连接表首先进行一次筛选,它会让符合这个条件的被连接表中的记录去参与与主表的连接操作,其他不符合on条件的记录根本就没有机会参与与主表的连接。
 SELECT A1.User_Id
,A1.Month_Id
,A1.Brand_Id
,A1.Rate
,A2.User_Id
,A2.Month_Id
,A2.Type_Id
FROM table_a A1
LEFT JOIN table_b A2
ON A1.User_Id=A2.User_Id
AND A1.Month_Id=A2.Month_Id
AND A1.Brand_Id='501B03'
AND A2.Type_Id=10
;

这个表就综合了上面两方面,使用Brand_Id='501B03'对主表进行一次筛选,让符合这一条件的记录参与与其他表的连接,其他记录不参与连接,但是仍进入结果表(空位字段补NULL);使用Type_Id=10对被连接表A2首先做一次筛选,让符合这一条件的记录参与与主表A1的连接,不符合这一条件的记录被剔除掉不予考虑,也没有机会参与连接和进入结果表。
(5)更改table_b的主键,将其设为(user_id,month_id),并添加一条记录如下:
这样再table_b中对应user_id=989832就有两条记录。
执行下面的SQL:
 SELECT A1.User_Id
,A1.Month_Id
,A1.Brand_Id
,A1.Rate
,A2.User_Id
,A2.Month_Id
,A2.Type_Id
FROM table_a A1
LEFT JOIN table_b A2
ON A1.User_Id=A2.User_Id
;

这样可以看到,最后查询结果集的记录数不再是14条记录,而是15条,这说明了一点,最后的结果集中的记录数并不是和主表中记录数一致的,而是由主表和被连接表根据连接条件共同确定的,还可以说明的一点是,不论on条件是什么样,多简单多复杂,只要没有where条件,最后的查询结果集中的记录数不会少于主表记录数。对于这个例子,主表中的14条记录都会进入结果表,由于主表中的连接条件只有User_Id相等,因此,对于A2表中的User_Id=989832由于存在两条记录,因此都会与A1表User_Id=989832的那一条记录相连,因此产生了两条连接结果记录,所以使得最后的结果集增至15条记录。

 SELECT A1.User_Id
,A1.Month_Id
,A1.Brand_Id
,A1.Rate
,A2.User_Id
,A2.Month_Id
,A2.Type_Id
FROM table_a A1
LEFT JOIN table_b A2
ON A1.User_Id=A2.User_Id
AND A1.Month_Id=A2.Month_Id
;

上面给A1和A2表的连接条件增加了一个Month_Id相等的条件,这样只有满足这一条件的A2表记录才会参与连接,这样就对A2表中的User_Id=989832剔除了一条记录,所以最后连接只产生了14条记录。

 
 
2、现有table_c,是用户访问上网品牌的频率表。Brand_Id是上网品牌,Rank_Id是它对于该用户的一个访问频率排名(Rate排名)。
现在要提取每个用户访问频率最高的前三项上网品牌,形成宽表,一个用户一条记录,没有的取空值。
SQL1: 
 SELECT a1.User_Id
,a1.User_Id
,a1.Brand_Id AS brand_rank1
,a2.Brand_Id AS brand_rank2
,a3.Brand_Id AS brand_rank3
FROM table_c AS a1
LEFT JOIN table_c AS a2
ON a1.Month_Id=a2.Month_Id
AND a1.User_Id=a2.User_Id
AND a2.Rank_Id=2
LEFT JOIN table_c AS a3
ON a1.Month_Id=a3.Month_Id
AND a1.User_Id=a3.User_Id
AND a3.Rank_Id=3
WHERE a1.Rank_Id=1
;
查询结果:
这正是我们期望的结果。
SQL2:

 SELECT a1.User_Id
,a1.User_Id
,a1.Brand_Id AS brand_rank1
,a2.Brand_Id AS brand_rank2
,a3.Brand_Id AS brand_rank3
FROM table_c AS a1
LEFT JOIN table_c AS a2
ON a1.Month_Id=a2.Month_Id
AND a1.User_Id=a2.User_Id
LEFT JOIN table_c AS a3
ON a1.Month_Id=a3.Month_Id
AND a1.User_Id=a3.User_Id
WHERE a1.Rank_Id=1
AND a2.Rank_Id=2
AND a3.Rank_Id=3
;

查询结果:

 
3、综上所述,予以总结如下:
(1)ON条件,不论是A1.COL1=A2.COL2还是A2.COL3=XX,都是对A2表(被连接表)进行的条件筛选,将符合这一条件的记录取出来,参与与主表的连接操作,不符合该条件的记录都会被考虑参与连接。对于条件A1.COL4=XXX,其作用是对A1表(主表)进行条件筛选,符合该条件的记录将会参与与其他表的连接,不符合该条件的记录也会进入最后的结果表,空位补NULL。而A1.COL1=A2.COL2其实也是对A1表的筛选,让满足条件的A1表中的记录参与与其他表的连接,不满足的空位补NULL继续进入结果表。不论怎么使用ON条件,只要没有WHERE条件筛选,最后查询的结果集的记录数都是大于等于主表原始的记录数。
(2)WHERE条件,是对查询完毕后的结果集进行的筛选。可使用的筛选条件字段为任意的,因为多表查询实质是多个表之间的全字段连接查询,只是可以指定最后对外显示多少个字段的记录。where条件会从根本上影响最后查询结果集的记录数。
(3)如果对连接查询后聚集函数结果进行的筛选则需要使用GROUP BY +HAVING搭配完成。
 

SQL中on和where的使用及其差异的更多相关文章

  1. SQL中Round(),Floor(),Ceiling()函数的浅析

    项目中的一个功能模块上用到了标量值函数,函数中又有ceiling()函数的用法,自己找了一些资料,对SQL中这几个函数做一个简单的记录,方便自己学习.有不足之处欢迎拍砖补充 1.round()函数遵循 ...

  2. 关于sql中in 和 exists 的效率问题,in真的效率低吗

    原文: http://www.cnblogs.com/AdamLee/p/5054674.html 在网上看到很多关于sql中使用in效率低的问题,于是自己做了测试来验证是否是众人说的那样. 群众: ...

  3. 学习sql中的排列组合,在园子里搜着看于是。。。

    学习sql中的排列组合,在园子里搜着看,看到篇文章,于是自己(新手)用了最最原始的sql去写出来: --需求----B, C, F, M and S住在一座房子的不同楼层.--B 不住顶层.C 不住底 ...

  4. SQL中distinct的用法

    SQL中distinct的用法   1.作用于单列 2.作用于多列 3.COUNT统计 4.distinct必须放在开头 5.其他 在表中,可能会包含重复值.这并不成问题,不过,有时您也许希望仅仅列出 ...

  5. hibernate中java类的成员变量类型如何映射到SQL中的数据类型变化

    hibernate映射文件??.hbm.xml配置映射元素详解--Hibernate映射类型 在从Hibernate的java的成员类型映射到SQL中的数据类型,其内映射方式它满足,SQL可以自己调制 ...

  6. C#调用SQL中的存储过程中有output参数,存储过程执行过程中返回信息

      C#调用SQL中的存储过程中有output参数,类型是字符型的时候一定要指定参数的长度.不然获取到的结果总是只有第一字符.本人就是由于这个原因,折腾了很久.在此记录一下,供大家以后参考! 例如: ...

  7. sql中case when语句的使用-来自网摘文章

    Case具有两种格式.简单Case函数和Case搜索函数. --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END ...

  8. SQL中inner join、outer join和cross join的区别

    对于SQL中inner join.outer join和cross join的区别简介:现有两张表,Table A 是左边的表.Table B 是右边的表.其各有四条记录,其中有两条记录name是相同 ...

  9. SQL中对于两个不同的表中的属性取差集except运算

    SQL中对两个集合取差集运算,使用except关键字,语法格式如下: SELECT column_name(s) FROM table_name1 EXCEPT SELECT column_name( ...

随机推荐

  1. patch需要数据格式前端算法,patch算法基础,两个对象对比取差异属性

    在我们的前端开发过程中,表单是最常见不过的了,一般我们创建表单的时候习惯使用post方法来提交数据,编辑表单时候喜欢put,但是当表单的数据非常多的时候,编辑起来很麻烦,首先需要获取初始化数据,然后把 ...

  2. bzoj 3343 分块

    因为询问比较少,所以我们可以将n个数分成sqrt(n)个块,每个块用一颗bst存一下,然后对于修改l,r,我们将l,r区间中整块的直接在bst上打一个标签,对于不是整块的我们直接暴力修改,对于询问l, ...

  3. bisai.py

    比赛专用py #!/usr/etc/env python #encoding:utf-8 #by i3ekr #token import re,os,requests res = "(fla ...

  4. FindQQByProcess

    看网上有许多通过进程寻找QQ号的例子,看了一下,里面涉及的知识点还是比较多,但网上的兼容性不太好,而且没有给出匹配字符的来源,所以自己动手写了一下,顺便给出一些我调试的结果. #include &qu ...

  5. 【Python学习笔记】异常处理try-except

    Python异常处理 我们一般使用try-except语句来进行异常处理. 使用except Exception as err可以统一捕捉所有异常,而也可以分开处理单个异常. # 分开捕捉单个异常 t ...

  6. linux平台学x86汇编语言学习集合帖

    linux平台学x86汇编语言学习集合帖 linux平台学x86汇编(一):https://blog.csdn.net/shallnet/article/details/45543237 linux平 ...

  7. macaca安装失败的解决办法!

    https://github.com/macacajs/macaca-android https://www.jianshu.com/p/76a5be6c1036

  8. agc016D - XOR Replace(图论 智商)

    题意 题目链接 给出两个长度为\(n\)的数组\(a, b\) 每次可以将\(a\)中的某个数替换为所有数\(xor\)之和. 若\(a\)数组可以转换为\(b\)数组,输出最少操作次数 否则输出\( ...

  9. eclipse+cmake+c++11+ros

    eclipse+cmake: https://www.vtk.org/Wiki/CMake:Eclipse_UNIX_Tutorial eclipse+c++11: https://wiki.ecli ...

  10. 基础平台为第三方应用接入提供oauth2认证接口

    oauth2开放认证协议原理及案例分析 http://blog.csdn.net/volcan1987/article/details/7287605 谈谈基于OAuth 2.0的第三方认证 [上篇] ...