前言

本节我们继续讲讲联接类型中的外部联接,本节之后我们将讲述有关联接性能以及更深入的知识,简短内容,深入的理解,Always to review the basics。

外部联接

外部联接又分为左外部联接和右外部联接,使用关键字分别是LEFT OUTER JOIN、RIGHT OUTER JOIN、FULL OUTER JOIN,在这里OUTER关键字时可选的。LEFT关键字表示保留左侧的行,RIGHT关键字表示保留右侧的行,FULL关键字表示左侧和右侧的行都保留。外部联接的第三个逻辑查询处理阶段识别保留表中基于ON谓词未能与另一个表匹配的行,此阶段添加这些行到前两个联接阶段生成的结果中,在这些外部行中,对于联接非保留侧的属性将使用NULL作为占位符。说了这么多,左外部联接就是以左表为基准,若右表满足条件则返回右侧的行,若不满足则返回NULL而非右侧的实际行数据,右外部联接同理。我们来看如下一个简单的例子

USE TSQL2012
GO SELECT C.custid, C.companyname, O.orderid
FROM Sales.Customers AS C
LEFT JOIN Sales.Orders AS O ON C.custid = O.custid

从上知,Sales.Customers表中的有一个客户没有任何订单,它的订单Id为22,通过左侧客户Id为22而右侧得到订单Id为NULL而得知。

超越外部联接基础知识

通过上述对外部联接的介绍,我们知道通过外部联接能够得到缺失值,也就是不满足条件则返回NULL。这里我们假设有如下一场景,我们需要查询Orders订单表中所有订单,要求确保在范围2006年1月1日至2008年12月31日中每天至少有一行输出,对于范围能具有的订单的日期不做任何操作,但希望输出中包含没有订单的日期,使用NULL标记作为订单属性占位符。我们第一步需要解决的是得到2006年1月1日至2008年12月31日的所有日期,上一篇我们讲过交叉联接,通过交叉联接我们生成了数字表,这个时候就派上用场了。

首先需要得到2006年1月1日至2008年12月31日之间间隔的天数,然后得到此间隔中的所有日期,如下:

USE TSQL2012
GO SELECT DATEADD(DAY, n - ,'') AS orderdate
FROM dbo.Nums
WHERE n <= DATEDIFF(DAY, '','') +
ORDER BY orderdate

接下来通过上述得到的连续日期与Sales.Orders表中的订单日期进行匹配,从而得到订单所有信息,利用左外部联接不满足条件则返回NULL。

USE TSQL2012
GO SELECT DATEADD(DAY, n - ,'') AS orderdate,O.orderid,
O.custid, O.empid
FROM dbo.Nums
LEFT JOIN Sales.Orders AS O
ON DATEADD(DAY, dbo.Nums.n - , '') = O.orderdate
WHERE dbo.Nums.n <= DATEDIFF(DAY, '','') +
ORDER BY orderdate

外部联接注意事项 (1)

(1)WHERE造成外部联接成为逻辑上的内部联接

我们看上述图中在订单日期等于2006-11-09时,此时orderid为NULL,此时我们首先来进行如下查询

USE TSQL2012
GO SELECT orderdate, orderid, custid, empid
FROM Sales.Orders
WHERE orderdate > ''

我们查询Sales.Orders表中订单日期大于2006-11-08订单信息,我们看下返回结果

此时我们发现订单日期为2006-11-09的订单信息没有,为何如此呢,因为利用WHERE子句它会过滤掉UNKNOWN即NULL值,为什么要讲这个呢,因为在外部联接中不满足条件的右表原本会返回NULL,但是若存在WHERE子句时,此时会导致所有外部行会被过滤掉,换句话说就是抵消了外部联接实际上在逻辑上就相当于是一个内部联接,这就在无意中造成了逻辑上的BUG。所以基于此我们可以得出如下结论:

结论:在外部联接中若利用WHERE子句会过滤掉NULL,会导致所有外部行被过滤掉,实际上会抵消外部联接,最终外部联接在逻辑上就成为了一个内部联接。

(2)多表联接造成外部联接成为逻辑上的内部联接

在进行多联接时比如说首先进行两个表的外部联接,紧接着后面跟了一个内部联接的第三个表,如果内部联接中子句的谓词对自外部联接非保留侧的属性和来自第三个表的属性进行比较,此时所有外部行都会被过滤掉。是什么意思呢,当利用外部联接时会可能返回外部行的NULL值,此时再利用内部联接,因为NULL与任何值进行比较都会生成UNKNOWN,所以此时UNKNOWN会被ON筛选过滤掉。同上也就抵消外部联接,造成外部联接成为逻辑上的内部联接。如下

USE TSQL2012
GO SELECT C.custid, O.orderid, OD.productid, OD.qty
FROM Sales.Customers AS C
LEFT JOIN Sales.Orders AS O ON O.custid = C.custid
INNER JOIN Sales.OrderDetails AS OD ON OD.orderid = O.orderid

一般来说,无论何种类型的外部联接后跟一个内部联接或是外部联接子查询,外部行都会被过滤掉,当然,这是假设联接条件对来自左侧的NULL标记和右侧的任意值进行比较。为了解决这种问题,我们可以通过如下三种方案来解决。

【1】将第二个内部联接替换为左外部联接。

USE TSQL2012
GO SELECT C.custid, O.orderid, OD.productid, OD.qty
FROM Sales.Customers AS C
LEFT JOIN Sales.Orders AS O ON O.custid = C.custid
LEFT JOIN Sales.OrderDetails AS OD ON OD.orderid = O.orderid

【2】首先使用内部联接,然后再使用右外部联接。

SELECT C.custid, O.orderid, OD.productid, OD.qty
FROM Sales.Orders AS O
LEFT JOIN Sales.OrderDetails AS OD ON OD.orderid = O.orderid
INNER JOIN Sales.Customers AS C ON O.custid = C.custid

【3】在原有基础上改变,将内部联接变成一个独立的逻辑阶段

USE TSQL2012
GO SELECT C.custid, O.orderid, OD.productid, OD.qty
FROM Sales.Customers AS C
LEFT JOIN
(Sales.Orders AS O INNER JOIN Sales.OrderDetails AS OD ON O.orderid = OD.orderid)
ON C.custid = O.custid

外部联接注意事项 (2)

在外部联接中使用COUNT(*)进行聚合时,它会考虑内部行和外部行,因为它会计算行数而不管它们的内容,如下:

USE TSQL2012
GO SELECT C.custid, COUNT(*) AS numorders
FROM Sales.Customers AS C
LEFT JOIN Sales.Orders AS O ON O.custid = C.custid
GROUP BY C.custid

由之前所查得知客户Id为22的orderid为NULL,即没有订单数量,所以这里就产生了BUG,因为COUNT(*)会包括NULL值,所以这里我们需要替换为COUNT(列名)。

USE TSQL2012
GO SELECT C.custid, COUNT(O.orderid) AS numorders
FROM Sales.Customers AS C
LEFT JOIN Sales.Orders AS O ON O.custid = C.custid
GROUP BY C.custid

总结

本节我们重点讲述了外部联接基本知识以及注意事项,我们下节将讲述联接综合知识,简短的内容,深入的理解,我们下节再会,good night。

SQL Server-外部联接基础回顾(十三)的更多相关文章

  1. [置顶] 图书推荐:SQL Server 2012 T-SQL基础 Itzik Ben-Gan

    经过近三个月的不懈努力,终于翻译完毕了.图书虽然是基础知识,但是,即使你已经使用T-SQL几年,很多地方还是能够弥补你的知识空白.大师级的人物写基础知识,或许你想知道这基础中还有哪些深奥,敬请期待吧. ...

  2. SQL Server外部链接时报错:Error locating serverInstance specified

    SQL Server外部链接时报错:Error locating server/Instance specified 连接时报错信息: 08001 sql server network interfa ...

  3. SQL Server-交叉联接、内部联接基础回顾(十二)

    前言 本节开始我们进入联接学习,关于连接这一块涉及的内容比较多,我们一步一步循序渐进学习,简短内容,深入的理解,Always to review the basics. 交叉联接(CROSS JOIN ...

  4. 《SQL Server 2012 T-SQL基础》读书笔记 - 5.表表达式

    Chapter 5 Table Expressions 一个表表达式(table expression)是一个命名的查询表达式,代表一个有效的关系表.SQL Server包括4种表表达式:派生表(de ...

  5. SQL Server 存储过程之基础知识(转)

    什么是存储过程呢?存储过程就是作为可执行对象存放在数据库中的一个或多个SQL命令. 通俗来讲:存储过程其实就是能完成一定操作的一组SQL语句. 那为什么要用存储过程呢?1.存储过程只在创造时进行编译, ...

  6. SQL Server数据仓库的基础架构规划

    问题 SQL Server数据仓库具有自己的特征和行为属性,有别去其他.从这个意义上说,数据仓库基础架构规划需要与标准SQL Server OLTP数据库系统的规划不同.在本文中,我们将介绍在计划数据 ...

  7. 《SQL Server 2012 T-SQL基础》读书笔记 - 4.子查询

    Chapter 4 Subqueries 子查询分为:独立子查询(Self-Contained Subqueries)和相关子查询(Correlated Subqueries),独立子查询可以单独拿出 ...

  8. 《SQL Server 2012 T-SQL基础》读书笔记 - 2.单表查询

    Chapter 2 Single-Table Queries GROUP BY之后的阶段的操作对象就是组(可以把一组想象成很多行组成的)了,HAVING负责过滤掉一些组.分组后的COUNT(*)表示每 ...

  9. [译]SQL Server 之 索引基础

    SQL Server中,索引以B-tree的结构组织数据.B-tree代表平衡树,但是SQL Server使用一种叫做B+的树. B+树不是总是保持严格的平衡的树. 首先,索引有两个主要的部件:一个页 ...

随机推荐

  1. HTTP协议系列(1)

    一.为什么学习Http协议       首先明白我们为什么学习HTTP协议,也就是说明白HTTP协议的作用.HTTP协议是用于客户端与服务器之间的通讯.明白了HTTP协议的作用也就知道了为什么要学习H ...

  2. 在Openfire上弄一个简单的推送系统

    推送系统 说是推送系统有点大,其实就是一个消息广播功能吧.作用其实也就是由服务端接收到消息然后推送到订阅的客户端. 思路 对于推送最关键的是服务端向客户端发送数据,客户端向服务端订阅自己想要的消息.这 ...

  3. JS核心系列:浅谈 call apply 与 bind

    在JavaScript 中,call.apply 和 bind 是 Function 对象自带的三个方法,这三个方法的主要作用是改变函数中的 this 指向,从而可以达到`接花移木`的效果.本文将对这 ...

  4. 2D、3D形变

    p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 17.0px Monaco; color: #a5b2b9 } span.Apple-tab-span { ...

  5. HTML DOM 对象

    本篇主要介绍HTML DOM 对象:Document.Element.Attr.Event等4个对象. 目录 1. Document 对象:表示文档树的根节点,大部分属性和方法都是对元素进行操作. 2 ...

  6. ZKWeb网页框架1.1正式发布

    发行日志 https://github.com/zkweb-framework/ZKWeb/blob/master/ReleaseNotes/ReleaseNote.1.1.md 主要改动 添加EFC ...

  7. pdo的使用

    PHP 数据对象 (PDO) 扩展为PHP访问数据库定义了一个轻量级的一致接口. PDO 提供了一个数据访问抽象层,这意味着,不管使用哪种数据库,都可以用相同的函数(方法)来查询和获取数据. PDO随 ...

  8. 【干货分享】流程DEMO-外出申请

    流程名: 外出申请  流程相关文件: 流程包.xml  流程说明: 直接导入流程包文件,即可使用本流程  表单:   流程: 图片:2.png DEMO包下载: http://files.cnblog ...

  9. Android中的多线程断点下载

    首先来看一下多线程下载的原理.多线程下载就是将同一个网络上的原始文件根据线程个数分成均等份,然后每个单独的线程下载对应的一部分,然后再将下载好的文件按照原始文件的顺序"拼接"起来就 ...

  10. 解决WINDOWS防火墙开启后Ping不通

    WINDOWS系统由于安全考虑,当开启防火墙时,默认不允许外主机对其进行ping功能,即别的电脑ping不通本机.别的主机ping不通本机是因为本机的防火墙关闭了ICMP回显功能,只要把这回显功能打开 ...