开心一刻

  楼主:心都让你吓出来了!

  狮王:淡定,打个小喷嚏而已

前情回顾

  神奇的 SQL 之 联表细节 → MySQL JOIN 的执行过程(一)中,我们讲到了 3 种联表算法:SNL、BNL 和 INL,了解了数据的查询方式是 one by one,联表方式也是 one by one ;并谈到了 ON 和 WHERE,对下图中所说的提出了质疑

  认为 ON 和 WHERE 的生效时机有待商榷;此时楼主开始了欠大家的账

  神奇的 SQL 之 联表细节 → MySQL JOIN 的执行过程(二)中对联表算法进行了补充,详细介绍了 MRR 和 BKA,但还是未介绍 ON 和 WHERE,楼主依旧欠着大家的账,内心涌满了愧疚

  终于在今天,楼主痛定思痛,决定将这笔账还上;此刻楼主的内心独白是这样的

  此时各位看官的内心肯定嘀咕着:你特么欠账欠的这么义愤填膺 ? 不过我好喜欢

  咳咳,闲话不多说,进入我们今天的正题

SQL 执行顺序

  SQL 的执行顺序相信大家多少有所了解,上网一搜也很快就能找到答案

  

  除了 WITH 用的比较少之外,其他都比较常用,相信大家对上面的执行顺序也没有什么疑问;我们重点关注下 JOIN、ON 和 WHERE

  

  那么 WHERE 是不是一定是在 ON 之后生效了 ? 我们带着这个疑问往下看

ON 和 WHERE 的常规区别

  on 针对的关联条件,是表与表之间通过哪些列、以什么条件进行关联,而 where 针对的是过滤条件;两者从概念上来讲是不同的

  另外 on 一定是与 join 一并使用的,join 会添加外部行,并将外部行中被驱动表的字段填充 null ,而 where 进行过滤的时候,只有逻辑判断为 true 的记录才会保留,逻辑值为 false 和 unknown 的记录都会过滤掉(更多详情:神奇的 SQL 之温柔的陷阱 → 三值逻辑 与 NULL!);两者得到的结果会有所不同

  上面说的可能有些抽象,我们结合具体示例来看;MySQL 版本 5.7.21 ,准备表和初始数据

create table tbl_a (a int primary key, b int, c int, d int, e varchar(50));
insert into tbl_a values (4,3,1,1,'a');
insert into tbl_a values (1,1,1,2,'d');
insert into tbl_a values (8,8,7,8,'h');
insert into tbl_a values (2,2,1,2,'g');
insert into tbl_a values (5,2,2,5,'e');
insert into tbl_a values (3,3,2,1,'c');
insert into tbl_a values (7,4,0,5,'b');
insert into tbl_a values (6,5,2,4,'f'); create table tbl_b like tbl_a;
insert into tbl_b SELECT * from tbl_a; insert into tbl_a values (9,9,9,9,'');
insert into tbl_b values (10,10,10,10,'');

  我们先来看看 left join(right join类似)

SELECT * FROM tbl_a a LEFT JOIN tbl_b b ON a.a = b.a AND a.b = b.b; /*query_on*/
SELECT * FROM tbl_a a LEFT JOIN tbl_b b ON a.a = b.a WHERE a.b = b.b; /*query_where*/

  

  我们可以看到:

    语句 query_on 返回了 tbl_a 中的全部记录,tbl_b 无对应记录的字段值填成 NULL,这是因为 join 会添加外部行,将 tbl_a 有而 tbl_b 中没有的记录添加到结果集

    语句 query_where 返回的是 8 行。因为最后的一行,在表 tbl_b 中没有匹配的字段,所以 where 后的 b.b 的值是 NULL,而 a.b 的值是 9,那么 where 9 = NULL 的结果是 unknown 而不是 true,因此这条记录不能作为结果集的一部分

  我们再来看看 inner join

SELECT * FROM tbl_a a INNER JOIN tbl_b b ON a.a = b.a AND a.b = b.b; /*query_on*/
SELECT * FROM tbl_a a INNER JOIN tbl_b b ON a.a = b.a WHERE a.b = b.b; /*query_where*/

  

  我们可以看到,执行结果是一样的,inner join 查询的就是驱动表与被驱动表同时存在的记录,所以过滤条件不管放在 ON 里,还是放在 WHERE 里,执行结果是一样的

ON 和 WHERE 的生效时机

  ON 后的关联条件与 WHERE 后的过滤条件,这两者的执行顺序是否如 SQL 执行顺序图中说的那样,ON 一定先与 WHERE ?

  问题先放着,我们以 left join 为例,来看看 4 个案例,也许从中能找到我们想要的答案

  1、左表与右表都没二级索引

    刚好上面的 tbl_a 和 tbl_b 满足条件,我们来看看 SQL 的执行计划

EXPLAIN SELECT * FROM tbl_a a
LEFT JOIN tbl_b b
ON a.b = b.b AND a.c = b.c
WHERE a.b >= 2 AND a.b < 10 AND a.c > 0
AND a.d != 1 AND a.e != 'a'

    

    驱动表是 tbl_a,这个相信大家没问题,我们重点看下 type 和 Extra

    type:上面的 ALL 表示全表扫描 a 表,下面的 ALL 表示全表关联,a 表中每一条满足条件的记录都会与 b 表中全部 9 条记录逐条进行关联

    Extra:Using where 表示要进行 WHERE 条件过滤,Using join buffer (Block Nested Loop) 表示用到了 BNL

    这条 SQL 的执行流程应该是这样的:

    

    此时大家看出什么了没 ? ON 后的关联条件是在 WHERE 后的过滤条件之前生效的吗 ?

    这个案例不太常见,因为表没有二级索引,我们接着往下看看有二级索引的情况

  2、左表有二级索引,右表无二级索引

    我们在 tbl_a 建一个组合索引 create index idx_bcd on tbl_a(b, c, d); ,然后往 tbl_a 和 tbl_b 中各插入 10W 条记录,我们再来看执行计划

    

    上图中红框标记的字段重点关注下,不知道字段含义的小伙伴,可以去翻翻我之前关于 explain的博客

    那么此时 SQL 的执行流程应该是这样的:

    

    就步骤 1 与 示例 1 中的步骤 1 不同,其余 2 步是一样的

    此时 WHERE 后的过滤条件的生效时机也是早于 ON 后的关联条件的

  3、左表无二级索引,右表有二级索引

    将 tbl_b 作为左表,tbl_a 作为右表,我们来看效果

    

    此时 SQL 的执行流程应该是这样的:

    

    此时 ON 后的关联条件的生效时机是早于 WHERE 后的过滤条件的

  4、左表与右表都有二级索引

    我们在 tbl_b 表上建一个组合索引 create index idx_bcd on tbl_b(b, c, d); 我们来看看 SQL 的执行计划

    

    此时 SQL 的执行流程应该是这样的:

    

    先是 WHERE 中的 Index Filter 条件生效,然后是 ON 后的关联条件生效,最后是 WHERE 中的 Table Filter 生效,关联条件的生效时间穿插在过滤条件的生效时间中

  自此,关于 ON 和 WHERE 的生效时机,你清楚了吗 ?

总结

  1、关联博客

    如果没有读楼主的前几篇博客,那么有些概念可能不理解,楼主把相关联的博客都列一下

    神奇的 SQL 之温柔的陷阱 → 三值逻辑 与 NULL

    神奇的 SQL 之 MySQL 执行计划 → EXPLAIN,让我们了解 SQL 的执行过程!

    神奇的 SQL 之 联表细节 → MySQL JOIN 的执行过程(一)

    神奇的 SQL 之 联表细节 → MySQL JOIN 的执行过程(二)

    神奇的 SQL 之 WHERE 条件的提取与应用

    神奇的 SQL 之 ICP → 索引条件下推

    对相关概念不了解的可以去对应的博客查阅

  2、ON 和 WHERE

    两者好区分,也容易混淆,他们在概念上就做了明确区分,但是又可以做概念之外的事,所以用着用着就开始混淆了

    楼主推荐:严格按他们的概念来处理,ON 后跟关联条件,其他的都放到 WHERE 后做过滤条件;尽量保证 SQL 语义清晰

    至于他两的生效时机,需要结合表结构,以及具体的 SQL 来分析,而不是 ON 一定先于 WHERE

参考

  What is the meaning of filtered in MySQL explain?

  MySQL的server层和存储引擎层是如何交互的

神奇的 SQL 之扑朔迷离 → ON 和 WHERE,好多细节!的更多相关文章

  1. 神奇的 SQL 之谓词 → 难理解的 EXISTS

    前言 开心一刻 我要飞的更高,飞的更高,啊! 谓词 SQL 中的谓词指的是:返回值是逻辑值的函数.我们知道函数的返回值有可能是数字.字符串或者日期等等,但谓词的返回值全部是逻辑值(TRUE/FALSE ...

  2. 神奇的 SQL 之 联表细节 → MySQL JOIN 的执行过程(二)

    开心一刻 一头母牛在吃草,突然一头公牛从远处狂奔而来说:“快跑啊!!楼主来了!” 母牛说:“楼主来了关我屁事啊?” 公牛急忙说:“楼主吹牛逼呀!” 母牛大惊,拔腿就跑,边跑边问:“你是公牛你怕什么啊? ...

  3. 神奇的 SQL 之 ICP → 索引条件下推

    开心一刻 楼主:来,我们先排练一遍 小伙伴们:好 嘿.哈.嚯 楼主:非常好,就是这个节奏,我们开始吧 楼主:啊.啊.啊,疼 ! 你们是不是故意的 ? 回表与覆盖索引 正式讲 ICP 之前了,我们先将相 ...

  4. 神奇的 SQL 之 HAVING → 容易被轻视的主角

    开心一刻 一天,楼主和隔壁小男孩一起坐电梯,中途进来一位高挑的美女,她牵着一条雪白的贵宾犬 小男孩看着这条雪白的贵宾犬,甚是喜欢,说道:阿姨,我能摸下这个狗狗吗? 美女:叫姐姐 小男孩低头看了下贵宾犬 ...

  5. 神奇的 SQL 之擦肩而过 → 真的用到索引了吗

    开心一刻 今天下班,骑着青桔电动车高高兴兴的哼着曲回家,感觉整个世界都是我的 刚到家门口,还未下车,老妈就气冲冲的走过来对我说道:"你表哥就比你大一岁,人家都买了奔驰了,50 多万!&quo ...

  6. 神奇的 SQL 之性能优化 → 让 SQL 飞起来

    开心一刻 一天,一个男人去未婚妻家玩,晚上临走时下起了大雨 未婚妻劝他留下来过夜,说完便去准备被褥,准备就绪后发现未婚夫不见了 过了好久,全身淋的像只落汤鸡的未婚夫回来了 未婚妻吃惊的问:" ...

  7. 神奇的 SQL 之别样的写法 → 行行比较

    开心一刻 昨晚我和我爸聊天 我:"爸,你怎么把烟戒了,也不出去喝酒了,是因为我妈不让,还是自己醒悟,开始爱惜自己啦?" 爸:"儿子啊,你说的都不对,是彩礼又涨价了.&qu ...

  8. 记一次神奇的sql查询经历,group by慢查询优化

    一.问题背景 现网出现慢查询,在500万数量级的情况下,单表查询速度在30多秒,需要对sql进行优化,sql如下: 我在测试环境构造了500万条数据,模拟了这个慢查询. 简单来说,就是查询一定条件下, ...

  9. 神奇的 SQL 之 CASE表达式,妙用多多 !

    前言 历史考试选择题:黄花岗起义第一枪谁开的? A宋教仁 B孙中山 C黄兴 D徐锡麟,考生选C. 又看第二题:黄花岗起义第二枪谁开的? 考生傻了,就选了个B. 接着看第三题:黄花岗起义中,第三枪谁开的 ...

随机推荐

  1. linux误删除恢复(未验证)

    extundelete 大家基本都知道,在linux上误删除了东西后果是很严重的,尤其是在服务器上误删除了东西,对于字符终端,想要实现恢复删除的数据更是难上加难,对于Linux误删除了重要的东西,虽然 ...

  2. LR及评分卡(未完成)

    主要分为如下内容: 一.线性回归 二.逻辑回归 三.逻辑回归评分卡流程 一.线性回归 二.逻辑回归 在线性回归的基础上引入了sigmoid函数,Logistic回归为什么要使用sigmoid函数 三. ...

  3. python3下scrapy爬虫(第五卷:初步抓取网页内容之scrapy全面应用)

    现在爬取http://category.dangdang.com/pg1-cid4008149.html网址上的商品价格,名称,评价数量 先准备下下数据:商品名,商品链接,评价数量 第一步:在item ...

  4. dotfuscator安装

    1.vs 2017 安装 dotfuscator 组件 打开vs 2017 按 ctrl + Q在输入框中输入“dotfuscator” ,选中第一个. 2.安装完成后即可在vs的工具中看到该组件 3 ...

  5. Linux和git使用

    一.Linux ​ cd . .. - ~ ls -a h l 通配符 mkdir bouch nano vim cat clear cp -r ./db/ ./lib/ mv -r rm -r wh ...

  6. Junit 单元测试在 intelliJ IDEA 中的安装

    1.为什么使用Junit我们都知道,main 方法是一个程序的入口,通常来说,没有main方法,程序就无法运行.我们经常会写一些class文件(如下图所示),他们并没有自己的main方法.那么我们如何 ...

  7. Lego:美团点评接口自动化测试实践

    概述 接口自动化概述   众所周知,接口自动化测试有着如下特点: 低投入,高产出. 比较容易实现自动化. 和UI自动化测试相比更加稳定. 如何做好一个接口自动化测试项目呢? 我认为,一个“好的”自动化 ...

  8. 生死状:苹果VS他的供应商

    据知情人士透露,苹果已经组建了代号为Titan的汽车团队,并招募了数百名员工,准备进入汽车领域,iCar大有呼之欲出之势.事实上,苹果CEO蒂姆-库克早在去年就参观了宝马位于莱比锡的核心工厂,学习如何 ...

  9. 如何进行Web服务的性能测试

         涉及到web服务的功能在不断的增加,对于我们测试来说,我们不仅要保证服务端功能的正确性,也要验证服务端程序的性能是否符合要求.那么性能测试都要做些什么呢?我们该怎样进行性能测试呢? 性能测试 ...

  10. Oracle介绍

    Published: 2016-11-08 22:15:00 In Data Mining. tags: SQL 版本与配置 企业版 标准版 个人版 事务性数据表 分析型数据表 PL/SQL 配置 控 ...