源自MySQL 5.7 官方手册:13.2.9.2 JOIN Syntax

SELECT select_expr
From table_references JOIN...
WHERE...

  如上所示,MySQL支持在table_references后添加JOIN选项作为SELECT语句的一部分,当然也可以在多表的DELETE和UPDATE。

  下面列出了JOIN的详细语法:

table_references:
escaped_table_reference [, escaped_table_reference] ... escaped_table_reference:
table_reference
| { OJ table_reference } table_reference:
table_factor
| joined_table table_factor:
tbl_name [PARTITION (partition_names)]
[[AS] alias] [index_hint_list]
| table_subquery [AS] alias
| ( table_references ) joined_table:
table_reference [INNER | CROSS] JOIN table_factor [join_specification]
| table_reference STRAIGHT_JOIN table_factor
| table_reference STRAIGHT_JOIN table_factor ON search_condition
| table_reference {LEFT|RIGHT} [OUTER] JOIN table_reference join_specification
| table_reference NATURAL [{LEFT|RIGHT} [OUTER]] JOIN table_factor join_specification:
ON search_condition
| USING (join_column_list) join_column_list:
column_name [, column_name] ... index_hint_list:
index_hint [, index_hint] ... index_hint:
USE {INDEX|KEY}
[FOR {JOIN|ORDER BY|GROUP BY}] ([index_list])
| {IGNORE|FORCE} {INDEX|KEY}
[FOR {JOIN|ORDER BY|GROUP BY}] (index_list) index_list:
index_name [, index_name] ...

一、表引用(table reference)

  一个表引用也被称为一个JOIN表达式。表引用(当它引用分区表时)可能有PARTITION选项,包括一个由逗号分隔的分区,子分区或两者皆有的列表。此选项紧跟在的名字之后,并在任何别名声明之前。此选项的作用是仅从列出的分区或子分区中选择数据行,而且将忽略列表中未命名的任何分区或子分区。see Section 22.5, “Partition Selection”。

  table_factor语法是MySQL对标准SQL中的扩展。标准SQL只接受table_reference,而不是一对括号内的列表。

  如果table_reference项列表中的每个逗号被视为内连接(INNER JOIN),则这是保守的扩展。例如:

SELECT * FROM t1 LEFT JOIN (t2, t3, t4)
ON (t2.a = t1.a AND t3.b = t1.b AND t4.c = t1.c)

等价于:

SELECT * FROM t1 LEFT JOIN (t2 CROSS JOIN t3 CROSS JOIN t4)
ON (t2.a = t1.a AND t3.b = t1.b AND t4.c = t1.c)

在MySQL中,JOIN,CROSS JOIN,和INNER JOIN 在语义上是等价的,他们可以相互替换。但是在标准SQL中,他们不等价,INNER JOIN与ON搭配使用,CROSS JOIN搭配其它。

  一般来说,在只有INNER JOIN操作的表达式中,括号可以被省略。MySQL还支持嵌套连接,

See Section 8.2.1.7, “Nested Join Optimization”。

  指定索引提示(Index  hints )能够影响MySQL优化器如何使用索引。更多信息,see Section 8.9.4, “Index Hints”.

  优化器提示和optimizer_switch系统变量是影响优化器使用索引的其他方法。See Section 8.9.3, “Optimizer Hints”, and Section 8.9.2, “Switchable Optimizations”。

二、在编写联接时要考虑的一般因素

  2.1

  可以使用tbl_name AS alias_name或tbl_name alias_name对表引用定义别名。

SELECT t1.name, t2.salary
FROM employee AS t1 INNER JOIN info AS t2 ON t1.name = t2.name; SELECT t1.name, t2.salary
FROM employee t1 INNER JOIN info t2 ON t1.name = t2.name;

  2.2

  table_subquery也称为FROM子句中的派生表或子查询。Section 13.2.10.8, “Derived Tables”.

  此类子查询必须包含别名,以便为子查询结果提供表名。一个简单的例子如下:

SELECT * FROM (SELECT 1, 2, 3) AS t1;

/*

+---+---+---+
| 1 | 2 | 3 |
+---+---+---+
| 1 | 2 | 3 |
+---+---+---+ */

  2.3

  在没有连接条件的情况下,INNER JOIN和“,”(逗号)在语义上是等效的——两者都在指定的表之间产生笛卡尔积,也就是说,第一个表中的每一行都连接到第二个表中的每一行。

  但是,逗号运算符的优先级比其它含有“JOIN”的运算符要小。如果在存在连接条件时将逗号连接与其他连接类型混合,则可能会报错:Unknown column 'col_name' in 'on clause' 。对这个问题的处理会在文章的后面讨论。

  与ON一起使用的search_condition是可以在WHERE子句中使用的任何条件表达式。ON子句用于指明如多表如何连接,WHERE子句则限制要包含在结果集中的行。

  2.4

  在LEFT JOIN中,如果在右表中没有匹配ON或者USING中条件的行,则该连接中中的右表的列全都设置为NULL。你可以利用这点来查找左表A中在右表B中没有任何对应项的行:

SELECT left_tbl.*
FROM left_tbl LEFT JOIN right_tbl ON left_tbl.id = right_tbl.id
WHERE right_tbl.id IS NULL;

  这个查询语句会找出左表left_tbl中这样的行:其ID值在右表right_tbl的ID列中不存在。See Section 8.2.1.8, “Outer Join Optimization”.(外连接包括LEFT JOIN和RIGHT JOIN)

  例如,我查找学生表stu中在成绩表sc中没有任何成绩的学生:

select stu.* 
from student as stu left join sc on stu.SId=sc.SId
where sc.SId is null; /* SId | Sname | Sage | Ssex |
+------+-------+---------------------+------+
| 09 | 张三 | 2017-12-20 00:00:00 | 女 |
| 10 | 李四 | 2017-12-25 00:00:00 | 女 |
| 11 | 李四 | 2017-12-30 00:00:00 | 女 |
| 12 | 赵六 | 2017-01-01 00:00:00 | 女 |
| 13 | 孙七 | 2018-01-01 00:00:00 | 女 |
+------+-------+---------------------+------+ */

  当然这里碰到了一个小问题,把查询语句的WHERE条件改成sc.SId=null时,取出的是空集:

select stu.*
from student as stu left join sc on stu.SId=sc.SId
where sc.SId=null; /* Empty set (0.08 sec) */

  在WHERE子句中,column = null永远不会为true,以这种方式使用null无效,要检测值为NULL的列,必须使用IS NULL或列IS NOT NULL。关于NULL的使用有专门的章节:Working with NULL Values。

  2.5

  USING(join_column_list)子句指定两个表中必须拥有的列的列表。如果表a和b都包含列c1,c2和c3,则以下连接将比较两个表中的相应列:

a LEFT JOIN b USING (c1, c2, c3)

  2.6

  两个表的NATURAL [LEFT] JOIN等下于下面的情况:带有USING子句的INNER JOIN或LEFT JOIN,该子句列出了在两个表中都存在的所有的列。

  2.7

  RIGHT JOIN的工作方式类似于LEFT JOIN。为了使代码可以跨数据库移植,建议您使用LEFT JOIN而不是RIGHT JOIN。

  2.8

  语法描述中的{ OJ...},只是为了兼容ODBC。这个花括号必须按字面编写。

SELECT left_tbl.*
FROM { OJ left_tbl LEFT OUTER JOIN right_tbl
ON left_tbl.id = right_tbl.id }
WHERE right_tbl.id IS NULL;

  您可以在{OJ ...}中使用其他类型的连接,例如INNER JOIN或RIGHT OUTER JOIN。这有助于与某些第三方应用程序兼容,但不是官方ODBC语法。

  2.9

  STRAIGHT_JOIN类似于JOIN,只是左表始终在右表之前读取。

  这可以用于连接优化器以次优顺序处理表的那些(少数)情况。 

  一些JOIN示例:

SELECT * FROM table1, table2;

SELECT * FROM table1 INNER JOIN table2 ON table1.id = table2.id;

SELECT * FROM table1 LEFT JOIN table2 ON table1.id = table2.id;

SELECT * FROM table1 LEFT JOIN table2 USING (id);

SELECT * FROM table1 LEFT JOIN table2 ON table1.id = table2.id
LEFT JOIN table3 ON table2.id = table3.id;

  Natural join和使用USING的JOIN,包括外连接的变体,是根据SQL-2003的标准进行处理的。

  

  2.10

  NATURAL连接中的冗余列不会显示。

CREATE TABLE t1 (i INT, j INT);
CREATE TABLE t2 (k INT, j INT);
INSERT INTO t1 VALUES(1, 1);
INSERT INTO t2 VALUES(1, 1);
SELECT * FROM t1 NATURAL JOIN t2;
SELECT * FROM t1 JOIN t2 USING (j);

  第一个和第二个SELECT语句中的“j”列,都只会出现一次:

/*

+------+------+------+
| j | i | k |
+------+------+------+
| 1 | 1 | 1 |
+------+------+------+ +------+------+------+
| j | i | k |
+------+------+------+
| 1 | 1 | 1 |
+------+------+------+ */

  冗余列的消除和列的排序都是根据标准SQL进行处理,按下面的顺序展示:

  • 首先,合并两个连接表的相同列,按他们在第一个表中出现的顺序排列;
  • 然后,第一个表所特有的列,按它们在该表中出现的顺序排列;
  • 第三,第二个表所特有的列,它们在该表中出现的顺序;

  取代两个表的相同列的单列是通过使用coalesce(合并)操作来定义的,也就是说,对于两个t1.a和t2.a,得到的单个连接列a被定义为a = COALESCE(t1.a,t2.a):

COALESCE(x, y) = (CASE WHEN x IS NOT NULL THEN x ELSE y END)

  

  如果任何其他的join操作,则连接的结果列由参与连接的表的所有列的串联组成。合并的列的定义结果是,对于外连接,如果两列中的一列始终为NULL,则合并列包含非NULL列的值。如果两列都不为NULL或者都为NULL,两个公共列具有相同的值,因此选择哪一列作为合并列的值就无关紧要了。解释这一点的一种简单方法是考虑外连接的合并列由JOIN的内部表的公共列表示。

  假设表t1(a,b)和t2(a,c)具有以下内容:

/*

t1    t2
---- ----
1 x 2 z
2 y 3 w */

  那么下面这个JOIN,列a包含的是t1.a的值:

SELECT * FROM t1 NATURAL LEFT JOIN t2;

+------+------+------+
| a | b | c |
+------+------+------+
| 1 | x | NULL |
| 2 | y | z |
+------+------+------+

  而下面的JOIN,恰好相反,a列包含的是t2.a的值:

SELECT * FROM t1 NATURAL RIGHT JOIN t2;
+------+------+------+
| a | c | b |
+------+------+------+
| 2 | z | y |
| 3 | w | NULL |
+------+------+------+

  将这些结果与JOIN ... ON的等效查询进行比较:

 SELECT * FROM t1 LEFT JOIN t2 ON (t1.a = t2.a);

+------+------+------+------+
| a | b | a | c |
+------+------+------+------+
| 1 | x | NULL | NULL |
| 2 | y | 2 | z |
+------+------+------+------+
SELECT * FROM t1 RIGHT JOIN t2 ON (t1.a = t2.a);

+------+------+------+------+
| a | b | a | c |
+------+------+------+------+
| 2 | y | 2 | z |
| NULL | NULL | 3 | w |
+------+------+------+------+

  2.11

  USING子句可以使用ON子句进行重写。尽管他们两个很像,但还是有所不同。

  看下下面两个查询:

a LEFT JOIN b USING (c1, c2, c3)
a LEFT JOIN b ON a.c1 = b.c1 AND a.c2 = b.c2 AND a.c3 = b.c3

  在筛选条件上,这两个连接在语义上是一致的。但是在“要为SELECT *扩展显示哪些列”上,这两个连接在语义上并不相同。USING连接选择相应列的合并值,而ON连接选择所有表中的所有列。

  对使用USING的JOIN,SELECT *选择这些值:

COALESCE(a.c1, b.c1), COALESCE(a.c2, b.c2), COALESCE(a.c3, b.c3)

  而使用ON的JOIN,SELECT *选择如下:

a.c1, a.c2, a.c3, b.c1, b.c2, b.c3

  对于内连接,COALESCE(a.c1,b.c1)与a.c1或b.c1相同,因为两列的值都相同。

  对于外连接(例如LEFT JOIN),两列中的一列可以为NULL。该列会从结果中略去。

  2.12

  ON子句只能引用其操作范围内的操作数。

CREATE TABLE t1 (i1 INT);
CREATE TABLE t2 (i2 INT);
CREATE TABLE t3 (i3 INT); SELECT * FROM t1 JOIN t2 ON (i1 = i3) JOIN t3;

  执这个SELECT语句会报错:Unknown column 'i3' in 'on clause' ,因为i3是t3中的一列,它不是ON子句的操作数。

  对此语句进行修改:

SELECT * FROM t1 JOIN t2 JOIN t3 ON (i1 = i3);

  对ON的作用范围进行测试,以下语句均能执行:

SELECT * FROM t1 JOIN t2 JOIN t3 ON (i2 = i3);
Empty set (0.00 sec) SELECT * FROM t1 JOIN t2 JOIN t3 ON (i1 = i2);
Empty set (0.00 sec)

  即ON对其之前的JOIN中的表的列都能引用。

  2.13

  JOIN比逗号操作符拥有更高的优先级,所以下面这个表达式:

t1, t2 JOIN t3

  会被解释为:

 (t1, (t2 JOIN t3))

  而不是:

((t1, t2) JOIN t3)

  这个特点会影响使用ON子句的语句,因为ON子句只能引用JOIN操作的表中的列,优先级会影响对这些操作表的解释。执行如下的语句就报错了:

SELECT * FROM t1,t2 JOIN t3 ON (i1 = i2);

ERROR 1054 (42S22): Unknown column 'i1' in 'on clause'

  而这样就能成功执行:

SELECT * FROM (t1,t2) JOIN t3 ON (i1 = i2);

Empty set (0.00 sec)

  或者不适用逗号:

SELECT * FROM t1 join t2 JOIN t3 ON (i1 = i2);

Empty set (0.00 sec)

  此外,INNER JOIN,CROSS JOIN,LEFT JOIN和RIGHT JOIN混合的语句中,所有这些语句的优先级都高于逗号运算符。

  2.14

  与SQL:2003标准相比,MySQL扩展是MySQL允许您限定NATURAL或USING连接的公共(coalesced合并)列,而标准SQL不允许这样做。

MySQL SELECT语法(三)JOIN语法详解的更多相关文章

  1. mysql备份的三种方式详解

    一.备份的目的 做灾难恢复:对损坏的数据进行恢复和还原需求改变:因需求改变而需要把数据还原到改变以前测试:测试新功能是否可用 二.备份需要考虑的问题 可以容忍丢失多长时间的数据:恢复数据要在多长时间内 ...

  2. Solr系列五:solr搜索详解(solr搜索流程介绍、查询语法及解析器详解)

    一.solr搜索流程介绍 1. 前面我们已经学习过Lucene搜索的流程,让我们再来回顾一下 流程说明: 首先获取用户输入的查询串,使用查询解析器QueryParser解析查询串生成查询对象Query ...

  3. 多表连接的三种方式详解 hash join、merge join、 nested loop

    在多表联合查询的时候,如果我们查看它的执行计划,就会发现里面有多表之间的连接方式.多表之间的连接有三种方式:Nested Loops,Hash Join 和 Sort Merge Join.具体适用哪 ...

  4. 《手把手教你》系列技巧篇(三十二)-java+ selenium自动化测试-select 下拉框(详解教程)

    1.简介 在实际自动化测试过程中,我们也避免不了会遇到下拉选择的测试,因此宏哥在这里直接分享和介绍一下,希望小伙伴或者童鞋们在以后工作中遇到可以有所帮助. 2.select 下拉框 2.1Select ...

  5. (转)总结之:CentOS 6.5 MySQL数据库的基础以及深入详解

    总结之:CentOS 6.5 MySQL数据库的基础以及深入详解 原文:http://tanxw.blog.51cto.com/4309543/1395539 前言 早期MySQL AB公司在2009 ...

  6. MYSQL之数据库初识、安装详解、sql语句基本操作

    目录 MYSQL之数据库初识及安装详解 1.什么是数据库? 1.什么是数据?(data) 2.什么是数据库?(databases,简称DB) 2.为什要用数据库? 3.什么是数据库管理系统?(Data ...

  7. 【转】MySQL用户管理及SQL语句详解

    [转]MySQL用户管理及SQL语句详解 1.1 MySQL用户管理 1.1.1 用户的定义 用户名+主机域 mysql> select user,host,password from mysq ...

  8. MySql绿色版配置及使用详解

    原文:MySql绿色版配置及使用详解 最近在做项目开发时用到了MySql数据库,在看了一些有关MySql的文章后,很快就上手使用了.在使用的过程中还是出现了一些问题,因为使用的是绿色免安装版的MySq ...

  9. MySQL数据库使用mysqldump导出数据详解

    mysqldump是mysql用于转存储数据库的实用程序.它主要产生一个SQL脚本,其中包含从头重新创建数据库所必需的命令CREATE TABLE INSERT等.接下来通过本文给大家介绍MySQL数 ...

  10. mysql数据库分区功能及实例详解

    分区听起来怎么感觉是硬盘呀,对没错除了硬盘可以分区数据库现在也支持分区了,分区可以解决大数据量的处理问题,下面一起来看一个mysql数据库分区功能及实例详解   一,什么是数据库分区 前段时间写过一篇 ...

随机推荐

  1. manjaro 18.10 install soft

    1.添加新账户 useradd username新建账户; useradd -d /home/xxx -m xxx创建用户,并同时生成用户目录,不然账户无法正常启用; passwd username修 ...

  2. EEPROM与FLASH

    最初的ROM rom最初不能编程,出厂什么内容就永远什么内容,不灵活.后来出现了prom,可以自己写入一次,要是写错了,只能换一片,自认倒霉. 人类文明不断进步,终于出现了可多次擦除写入的EPROM, ...

  3. Understanding Models, Views, and Controllers (C#)

    https://docs.microsoft.com/en-us/aspnet/mvc/overview/older-versions-1/overview/understanding-models- ...

  4. MySQL ALTER命令-修改数据表名或者修改数据表字段

    需要修改数据表名或者修改数据表字段时,就需要使用到MySQL ALTER命令. 删除,添加或修改表字段 如下命令使用了 ALTER 命令及 DROP 子句来删除表的 i 字段: ALTER TABLE ...

  5. log4net通过代码控制按分类输出

    应用场景: 比如我们系统有5个任务,每个任务都是独立的流程,按照传统的方式这些流程的数据会输出到一起,这无疑给我们排查问题增加了难度,因为我们需要的是每一个任务一个独立的输出文件,比如任务A输出到lo ...

  6. php-fpm 重启

    查看php-fpm进程数:ps aux | grep -c php-fpm [root@ssy106c14c190c69 etc]# ps -ef | grep php-fpm ---  查看php- ...

  7. CentOS查看每个进程的网络流量

    所需工具nethogs 安装:yum install -y nethogs 使用:nethogs eth0 sudo nethogs -s //按接收流量大小排序 如上图,PID一列就是进程的PID, ...

  8. Spring Aop(十一)——编程式的创建Aop代理之ProxyFactory

    转发地址:https://www.iteye.com/blog/elim-2397388 编程式的创建Aop代理之ProxyFactory Spring Aop是基于代理的,ProxyFactory是 ...

  9. GitHub快速搭建个人博客

    > 正所谓前人栽树,后人乘凉.> > 感谢[Huxpro](https://github.com/huxpro)提供的博客模板> > [我的的博客](https://fl ...

  10. 一步步分析Java深拷贝的两种方式-clone和序列化

    今天遇到一道面试题,询问深拷贝的两种方法.主要就是clone方法和序列化方法.今天就来分析一下这两种方式如何实现深拷贝.如果想跳过解析的朋友,直奔"重点来了!"寻找答案. clon ...