SQL进阶系列之5外连接的用法

写在前面

SQL本身是作为一种数据提取工具而出现，使用SQL生成各种定制化报表和非定制化报表并非SQL原本用途的功能，但这并不意味着SQL无法实现这些功能。

用外连接进行行列转换(1)(行 → 列)：制作交叉表

-- 建表语句

/* 用外连接进行行列转换（1）（行→列）：制作交叉表 */

CREATE TABLE Courses

(name   VARCHAR(32),

 course VARCHAR(32),

 PRIMARY KEY(name, course));

INSERT INTO Courses VALUES('赤井', 'SQL入门');

INSERT INTO Courses VALUES('赤井', 'UNIX基础');

INSERT INTO Courses VALUES('铃木', 'SQL入门');

INSERT INTO Courses VALUES('工藤', 'SQL入门');

INSERT INTO Courses VALUES('工藤', 'Java中级');

INSERT INTO Courses VALUES('吉田', 'UNIX基础');

INSERT INTO Courses VALUES('渡边', 'SQL入门');

-- 水平展开求交叉表(1):使用外连接

SELECT C0.name,

CASE WHEN C1.name IS NOT NULL THEN '○' ELSE NULL END AS “SQL入门",

CASE WHEN C2.name IS NOT NULL THEN '○' ELSE NULL END AS "UNIX基础",

CASE WHEN C3.name IS NOT NULL THEN '○' ELSE NULL END AS "Java中级"

FROM (SELECT DISTINCT name FROM Courses) AS C0

LEFT JOIN (SELECT name FROM Courses WHERE course = 'SQL入门') AS C1 ON C0.name = C1.name

LEFT JOIN (SELECT name FROM Courses WHERE course = 'UNIX基础') AS C2 ON C0.name = C2.name

LEFT JOIN (SELECT name FROM Courses WHERE course = 'Java中级') AS C3 ON C0.name = C3.name;

-- 评价：方法直观并容易理解，但大量用到内嵌视图和连接操作，随着列数增加，代码会臃肿，性能也会恶化

-- 水平展开求交叉表(2):使用标量子查询

SELECT C0.name,

(SELECT '○' FROM Courses AS C1 WHERE course = 'SQL入门' AND C1.name = C0.name) AS "SQL入门",

(SELECT '○' FROM Courses AS C2 WHERE course = 'UNIX基础' AND C2.name = C0.name) AS "UNIX基础",

(SELECT '○' FROM Courses AS C3 WHERE course = 'Java中级' AND C3.name = C0.name) AS "Java中级"

FROM (SELECT DISTINCT name FROM Courses) AS C0;

-- 在增加课程时，只需要修改SELECT子句后面的内容，代码修改比较简单，应对需求变更比较理想，缺点是性能不好，在SELECT子句中使用标量子查询和关联子查询时，计算开销较大

-- 水平展开求交叉表(3):嵌套使用CASE WHEN表达式

SELECT name,

CASE WHEN SUM(CASE WHEN course = 'SQL入门' THEN 1 ELSE 0 END) = 1 THEN '○' ELSE NULL END AS "SQL入门",

CASE WHEN SUM(CASE WHEN course = 'UNIX基础' THEN 1 ELSE 0 END) = 1 THEN '○' ELSE NULL END AS "UNIX基础",

CASE WHEN SUM(CASE WHEN course = 'Java中级' THEN 1 ELSE 0 END) = 1 THEN '○' ELSE NULL END AS "Java中级"

FROM Courses

GROUP BY name;

用外连接进行行列转换(2)(列 → 行)：汇总重复项于一列

-- 建表语句

/* 用外连接进行行列转换（2）（列→行）：汇总重复项于一列 */

CREATE TABLE Personnel

 (employee   varchar(32),

  child_1    varchar(32),

  child_2    varchar(32),

  child_3    varchar(32),

  PRIMARY KEY(employee));

INSERT INTO Personnel VALUES('赤井', '一郎', '二郎', '三郎');

INSERT INTO Personnel VALUES('工藤', '春子', '夏子', NULL);

INSERT INTO Personnel VALUES('铃木', '夏子', NULL,   NULL);

INSERT INTO Personnel VALUES('吉田', NULL,   NULL,   NULL);

-- 列数据转行数据(不去除空行)

SELECT employee,child_1 FROM Personnel

UNION ALL

SELECT employee,child_2 FROM Personnel

UNION ALL

SELECT employee,child_3 FROM Personnel;

-- 列数据转行数据(去除空行)

SELECT employee,child_1 FROM Personnel WHERE child_1 IS NOT NULL

UNION ALL

SELECT employee,child_2 FROM Personnel WHERE child_2 IS NOT NULL

UNION ALL

SELECT employee,child_3 FROM Personnel WHERE child_3 IS NOT NULL;

-- 按需自定义保留记录(不完全去除重复行)

-- 准备所有孩子的视图

CREATE VIEW Children(child) AS

SELECT child_1 FROM Personnel

UNION SELECT child_2 FROM Personnel

UNION SELECT child_3 FROM Personnel;

-- 获取员工子女列表的SQL语句(没有孩子的员工也要输出)

SELECT Personnel.employee,Children.child

FROM Personnel

LEFT JOIN Children

ON Children.child IN (Personnel.child_1,Personnel.child_2,Personnel.child_3);

在交叉表里制作嵌套式表侧栏

/* 在交叉表里制作嵌套式表侧栏 */

CREATE TABLE TblSex

(sex_cd   char(1),

 sex varchar(5),

 PRIMARY KEY(sex_cd));

CREATE TABLE TblAge

(age_class char(1),

 age_range varchar(30),

 PRIMARY KEY(age_class));

CREATE TABLE TblPop

(pref_name  varchar(30),

 age_class  char(1),

 sex_cd     char(1),

 population integer,

 PRIMARY KEY(pref_name, age_class,sex_cd));

INSERT INTO TblSex (sex_cd, sex ) VALUES('m',	'男');

INSERT INTO TblSex (sex_cd, sex ) VALUES('f',	'女');

INSERT INTO TblAge (age_class, age_range ) VALUES('1',	'21岁～30岁');

INSERT INTO TblAge (age_class, age_range ) VALUES('2',	'31岁～40岁');

INSERT INTO TblAge (age_class, age_range ) VALUES('3',	'41岁～50岁');

INSERT INTO TblPop VALUES('秋田', '1', 'm', 400 );

INSERT INTO TblPop VALUES('秋田', '3', 'm', 1000 );

INSERT INTO TblPop VALUES('秋田', '1', 'f', 800 );

INSERT INTO TblPop VALUES('秋田', '3', 'f', 1000 );

INSERT INTO TblPop VALUES('青森', '1', 'm', 700 );

INSERT INTO TblPop VALUES('青森', '1', 'f', 500 );

INSERT INTO TblPop VALUES('青森', '3', 'f', 800 );

INSERT INTO TblPop VALUES('东京', '1', 'm', 900 );

INSERT INTO TblPop VALUES('东京', '1', 'f', 1500 );

INSERT INTO TblPop VALUES('东京', '3', 'f', 1200 );

INSERT INTO TblPop VALUES('千叶', '1', 'm', 900 );

INSERT INTO TblPop VALUES('千叶', '1', 'f', 1000 );

INSERT INTO TblPop VALUES('千叶', '3', 'f', 900 );

-- 构造侧边栏

SELECT age_class,age_range,sex_cd,sex

FROM TblAge CROSS JOIN TblSex;

-- 处理TblPop表

SELECT age_class,sex_cd,

SUM(CASE WHEN pref_name IN ('秋田','青森') THEN population ELSE 0 END) AS "东北",

SUM(CASE WHEN pref_name IN ('东京','千叶') THEN population ELSE 0 END) AS "关东"

FROM TblPop

GROUP BY age_class,sex_cd;

-- 连接两张表

SELECT A.age_range,A.sex,B.东北,B.关东

FROM (SELECT age_class,age_range,sex_cd,sex FROM TblAge CROSS JOIN TblSex) AS A

LEFT JOIN (SELECT age_class,sex_cd,

SUM(CASE WHEN pref_name IN ('秋田','青森') THEN population ELSE 0 END) AS "东北",

SUM(CASE WHEN pref_name IN ('东京','千叶') THEN population ELSE 0 END) AS "关东"

FROM TblPop

GROUP BY age_class,sex_cd) AS B

ON A.age_class = B.age_class and A.sex_cd = B.sex_cd;

作为乘法运算的连接

-- 建表语句

/* 作为乘法运算的连接 */

CREATE TABLE Items

 (item_no INTEGER PRIMARY KEY,

  item    VARCHAR(32) NOT NULL);

INSERT INTO Items VALUES(10, 'FD');

INSERT INTO Items VALUES(20, 'CD-R');

INSERT INTO Items VALUES(30, 'MO');

INSERT INTO Items VALUES(40, 'DVD');

CREATE TABLE SalesHistory

 (sale_date DATE NOT NULL,

  item_no   INTEGER NOT NULL,

  quantity  INTEGER NOT NULL,

  PRIMARY KEY(sale_date, item_no));

INSERT INTO SalesHistory VALUES('2007-10-01',  10,  4);

INSERT INTO SalesHistory VALUES('2007-10-01',  20, 10);

INSERT INTO SalesHistory VALUES('2007-10-01',  30,  3);

INSERT INTO SalesHistory VALUES('2007-10-03',  10, 32);

INSERT INTO SalesHistory VALUES('2007-10-03',  30, 12);

INSERT INTO SalesHistory VALUES('2007-10-04',  20, 22);

INSERT INTO SalesHistory VALUES('2007-10-04',  30,  7);

-- 要求得到所有item即便没有销售记录的quantity求和

-- 方法一：连接前聚合，然后一对一进行连接

SELECT Items.item_no,SH.quantity

FROM Items LEFT JOIN (

SELECT item_no,sum(quantity) as quantity

FROM SalesHistory

GROUP BY item_no) AS SH

ON Items.item_no = SH.item_no;

-- 评价：从性能角度讲,通过聚合将SH上的item_no变成了非空不重复，但SH本身不存在主键索引，无法利用查询优化

-- 方法二：一对多进行连接不会增加行

SELECT Items.item_no,sum(SH.quantity) AS quantity

FROM Items

LEFT JOIN SalesHistory AS SH

ON Items.item_no = SH.item_no

GROUP BY Items.item_no;

-- 评价：这种方法没有使用临时视图，性能会有所改善

全外连接

面向集合的角度理解连接类型

左外连接 LEFT OUTER JOIN
右外连接 RIGHT OUTER JOIN
全外连接 FULL OUTER JOIN

/* 全外连接 */

CREATE TABLE Class_A

(id char(1),

 name varchar(30),

 PRIMARY KEY(id));

CREATE TABLE Class_B

(id   char(1),

 name varchar(30),

 PRIMARY KEY(id));

INSERT INTO Class_A (id, name) VALUES('1', '田中');

INSERT INTO Class_A (id, name) VALUES('2', '铃木');

INSERT INTO Class_A (id, name) VALUES('3', '伊集院');

INSERT INTO Class_B (id, name) VALUES('1', '田中');

INSERT INTO Class_B (id, name) VALUES('2', '铃木');

INSERT INTO Class_B (id, name) VALUES('4', '西园寺');

-- 全外连接保留全部信息

SELECT

COALESCE(A.id,B.id) AS id,A.name AS a_name,B.name AS b_name

FROM Class_A AS a FULL JOIN Class_B AS b

ON A.id = B.id;

-- 数据库不支持全外连接时的替代方案

SELECT A.id AS id,A.name,B.name FROM Class_A AS A LEFT JOIN Class_B AS B ON A.id = B.id

UNION

SELECT B.id AS id,A.name,B.name FROM Class_A AS A RIGHT JOIN Class_B AS B ON A.id = B.id;

INNER JOIN(或者INTERSECT)相当于交集，UNION(LEFT JOIN AND RIGHT JOIN ，再或者FULL JOIN)相当于并集

用外连接进行集合运算

用外连接求差集：A-B

SELECT A.id,A.name AS A_name,B.name AS B_name FROM Class_A AS A LEFT JOIN Class_B AS B ON A.id = B.id WHERE B.name IS NULL;

用外连接求差集：B-A

SELECT A.id,A.name AS A_name,B.name AS B_name FROM Class_A AS A RIGHT JOIN Class_B AS B ON A.id = B.id WHERE A.name IS NULL;

用全外连接求异或集

SELECT COALESCE(A.id,B.id) AS id,COALESCE(A.name,B.name) AS name FROM Class_A AS A FULL JOIN Class_B AS B ON A.id = B.id WHERE A.name IS NULL OR B.name IS NULL;

本节小结

SQL不是用来生成报表的语言，不建议用齐进行格式转换
必要时可以考虑外连接和CASE表达式来解决问题
生成嵌套表侧栏时，如果先生成主表的笛卡尔积再进行连接，很容易就可以完成
从行数来看，表连接可以看成乘法。因此，当表之间是一对多的关系时，连接后行数不会增加
外连接的思想和集合运算很像，使用外连接可以实现各种集合运算

练习题

-- 练习题 1-5-1 ：先连接还是先聚合

SELECT master.age_range,master.sex,

SUM(CASE WHEN data.pref_name IN ('青森','秋田') THEN population ELSE NULL END) AS "东北",

SUM(CASE WHEN data.pref_name IN ('东京','千叶') THEN population ELSE NULL END) AS "关东"

FROM (TblAge CROSS JOIN TblSex) AS master

LEFT JOIN TblPop AS data

ON master.age_class = data.age_class

AND master.sex_cd = data.sex_cd

GROUP BY master.age_range,master.sex;

-- 练习题 1-5-2：请留意孩子的人数

SELECT Personnel.employee,COUNT(Children.child)

FROM Personnel

LEFT JOIN Children

ON Children.child IN (Personnel.child_1,Personnel.child_2,Personnel.child_3)

GROUP BY Personnel.employee;

-- 练习题 1-5-3 全外连接和merge运算符

MERGE INTO Class_A A

    USING (SELECT *

             FROM Class_B ) B

      ON (A.id = B.id)

    WHEN MATCHED THEN

        UPDATE SET A.name = B.name

    WHEN NOT MATCHED THEN

        INSERT (id, name) VALUES (B.id, B.name);

SQL进阶系列之5外连接的用法的更多相关文章

外连接的用法 -- 《SQL进阶教程》 jupyter note
import pandas as pd import sqlite3 conn = sqlite3.connect('1-5.db') 用外连接进行行列转换1(行 -> 列): 制作交叉表怎么 ...
Sql Server系列：多表连接查询
连接查询是关系数据中最主要的查询,包括内连接.外连接等.通过连接运算符可以实现多个表查询.内连接查询操作列出与连接条件匹配的数据行,它使用比较运算符比较被连接列的列值.SQL Server中的内连接有 ...
SQL进阶系列之9用SQL处理数列
写在前面关系模型的数据结构里,并没有顺序的概念,但SQL处理有序集合也有坚实的理论基础生成连续编号 --生成连续编号 CREATE TABLE Digits (digit INTEGER PRIM ...
SQL进阶系列之6用关联子查询比较行与行
写在前面使用SQL对同一行数据进行列间的比较很简单,只需要在WHERE子句里写上比较条件就可以了,对于不同行数据进行列间比较需要使用自关联子查询. 增长.减少.维持现状需要用到行间比较的经典场景是 ...
SQL进阶系列之2自连接
写在前面一般地,SQL的连接运算根据其特征的不同,有着不同的名称,比如内连接.外连接.交叉连接等,这些连接大多是以不同的表或视图为对象进行的,针对相同的表进行的连接成为自连接.理解自连接有助于我们理 ...
Oracle学习笔记：外连接(+)的用法
Oracle中常用 left join 和 right join 来进行外连接,同时,oracle也支持 (+) 的特殊用法,也是表示外连接,并且总是放在非主表的一方. 例如: 左外连接: selec ...
Mysql SQL优化系列之——执行计划连接方式浅释
关系库SQL调优中,虽然思路都是一样的,具体方法和步骤也是大同小异,但细节却不容忽视,尤其是执行计划的具体细节的解读中,各关系库确实有区别,特别是mysql数据库,与其他关系库的差别更大些,下面,我们 ...
SQL进阶系列之12SQL编程方法
写在前面 KISS -- keep it sweet and simple 表的设计注意命名的意义英文字母 + 阿拉伯数字 + 下划线"_" 属性和列编程的方针写注释注意 ...
SQL进阶系列之11让SQL飞起来
写在前面 SQL的性能优化是数据库使用者必须面对的重要问题,本节侧重SQL写法上的优化,SQL的性能同时还受到具体数据库的功能特点影响,这些不在本节讨论范围之内使用高效的查询参数是子查询时,使用E ...

随机推荐

element ui 下拉框绑定对象并且change传多个参数
废话不说直接上代码说明真相. <template> <div class="hello"> <span>可以设置的属性 value-key=&q ...
linux查看端口常用命令
netstat命令参数: -t : 指明显示TCP端口 -u : 指明显示UDP端口 -l : 仅显示监听套接字(所谓套接字就是使应用程序能够读写与收发通讯协议(protocol)与资料的程序) -p ...
Access to XMLHttpRequest at 'http://127.0.0.1:8000/XXXXX' from origin 'http://localhost
Django 报错,跨域请求出现问题. 在settings.py中添加 #设置可跨域范围 CORS_ALLOW_CREDENTIALS = True CORS_ORIGIN_ALLOW_ALL = T ...
Data-Structure-Notes
Data Structure Notes Chapter-1 Sorting Algorithm Selection Sorting: /* * Selection Sort */ template& ...
51book机票接口对接，吐血整理（含PHP封装代码）
前言最近在对接51book的机票接口,遇到了挺多坑,所以整理一份作为记录机票有两个不同的接口,一个是机票,另一个是保险一.申请要接51book的机票,首先是要申请账号,这时候应该是有客户经理跟 ...
第3课，python使用for循环
前言: 学习了python的while循环后感觉循环是挺强大的.下面学习一个更智能,更强大的循环-- for循环. 课程内容: 1.由while循环,到for循环,格式和注意项 2.for循环来报数 ...
介绍一款好用的命令行工具Cmder
一.Cmder的介绍: 在大多数情况下,我们都想复制命令行窗口中的命令行,但是cmd复制粘贴大家都懂得:有没有更好的工具替代呢? 答案是肯定的,今天我将为大家介绍一款工具--Cmder. Cmder可 ...
Shell编程学习（七）
if 条件语句的知识与实践 if 条件语句 if条件语句的语法单分支结构第一种 if <条件测试表达式> then 指令 fi 第二种 if <条件测试表达式>; then ...
POI2015 WYC
也许更好的阅读体验 \(\mathcal{Description}\) 给定一张n个点m条边的带权有向图,每条边的边权只可能是1,2,3中的一种.将所有可能的路径按路径长度排序,请输出第k小的路径的长 ...
aria2 cmd set chmod, and others..
import 'package:flutter/material.dart'; import 'dart:io'; import 'dart:async'; import 'package:rxdar ...

SQL进阶系列之5外连接的用法

写在前面

用外连接进行行列转换(1)(行 → 列)：制作交叉表

用外连接进行行列转换(2)(列 → 行)：汇总重复项于一列

在交叉表里制作嵌套式表侧栏

作为乘法运算的连接

全外连接

用外连接进行集合运算

用外连接求差集：A-B

用外连接求差集：B-A

用全外连接求异或集

本节小结

练习题

SQL进阶系列之5外连接的用法的更多相关文章

随机推荐

热门专题