Nested loops、Hash join、Sort merge join（三种连接类型原理、使用要点）

nested loop 嵌套循环（原理）：
oracle从较小结果集（驱动表、也可以被称为outer）中读取一行，然后和较大结果集（被侦查表，也可以叫做inner）中的所有数据逐条进行比较（也是等值连接，也可以是非等值连接），如果符合规则，就放在结果集中，然后取驱动表的下一条数据继续循环，直到结束。
简单的理解就是：从A表抽一条记录，遍历B表查找匹配记录，然后从a表抽下一条，遍历B表，就是一个二重循环。

使用要点：
1.驱动表的记录集比较小，一般来说小于驱动表结果集的10%
2.inner表需要有有效的访问方法（Index），选择性要高。

hash join 哈希连接（原理）：
表T1和T2在施加了目标SQL中指定的谓词条件（如果有的话）后得到的结果集中数据量较小的那个结果集（S）会被Oracle选为哈希连接的驱动结果集，T2所对应的结果集的数据量相对较大，我们记为B；S是驱动结果集，B是被驱动结果集；接着Oracle会遍历S，读取S中的每一条记录，并对S中的每一条记录按照该记录在表T1中的连接列做哈希运算，直到遍历完S中的所有记录为止；Oracle会遍历B，读取B中的每一条记录，并对B中的每一条记录按照该记录在表T2中的连接列做哈希运算，最后hash值匹配hash值，返回结果。
简单的理解：将A表按连接键计算出一个hash表，然后从B表一条条抽取记录，计算hash值，根据hash到A表的hash来匹配符合条件的记录。

使用要点：
1. hash join在 oltp 环境下一般没什么优化的地方，在 olap环境中可以并行优化 hash join
2. 返回大量结果集（几w+）适合走hash join
3. hash join选择小表作为驱动表，注意这里的小表不是指表的行数，而是指的行数*列的宽度，可以简单的理解为 segment size。
4. hash join会使用到pga中的WORK AREA ，如果等待事件中有on-disk hash join( direct path read/write temp ),可以加大pga size。
5.hash join不适合驱动表表关联字段分布不均匀的情况。

(可以通过10046跟踪，然后查看 Maximum number of rows in a bucket 是否成千上万< 假象执行计划没有问题，但一个超大bucket，将hash join效率极度拉低，消耗大量cpu time >，一般个数在个位数性能最好，如果一个hash bucket的rows过多，可以改写sql，改变hash table 的列值 ) 10046跟踪显示的hash buckets 信息>

### Hash table overall statistics ###

Total buckets: 16384 Empty buckets: 9306 Non-empty buckets: 7078

Total number of rows: 9232

Maximum number of rows in a bucket: 5

Average number of rows in non-empty buckets: 1.304323

sort merge join 排序合并连接（原理）：
先排序操作(Sort)，再合并操作(Merge)。
简单的理解：将A，B表都排好序，然后做merge，符合条件的选出。

使用要点：
1. 排序合并连接的表无驱动顺序。
2. 排序合并连接不适用于的连接条件是：不等于<>，like,其中大于>，小于<，大于等于>=，小于等于<=，是可以适用于排序合并连接
3. 排序合并连接的表需要排序，用到SORT_AREA_SIZE。
4. 驱动表和被驱动表都是最多只被访问一次。

HINT：

操作 Nest Loop Hash Join Sort Mereg

Join USE_NL USE_HASH USE_MERGE

Anti Join NL_AJ HASH_AJ MERGE_AJ

Semi NL_SJ HASH_SJ MERGE_SJ

Nested loops、Hash join、Sort merge join（三种连接类型原理、使用要点）的更多相关文章

NESTED LOOPS & HASH JOIN & SORT MERGE JOIN
表连接方式及使用场合 NESTED LOOP 对于被连接的数据子集较小的情况,nested loop连接是个较好的选择.nested loop就是扫描一个表,每读到一条记录,就根据索引去另一个表里面查 ...
Sort merge join、Nested loops、Hash join（三种连接类型）
目前为止,典型的连接类型有3种: Sort merge join(SMJ排序-合并连接):首先生产driving table需要的数据,然后对这些数据按照连接操作关联列进行排序:然后生产probed ...
Oracle 三种连接方式 NESTED LOOP HASH JOIN SORT MERGE JOIN
NESTED LOOP: 对于被连接的数据子集较小的情况,嵌套循环连接是个较好的选择.在嵌套循环中,内表被外表驱动,外表返回的每一行都要在内表中检索找到与它匹配的行,因此整个查询返回的结果集不能太大( ...
浅谈SQL Server中的三种物理连接操作(Nested Loop Join、Merge Join、Hash Join)
简介在SQL Server中,我们所常见的表与表之间的Inner Join,Outer Join都会被执行引擎根据所选的列,数据上是否有索引,所选数据的选择性转化为Loop Join,Merge J ...
Nested Loops，Hash Join 和 Sort Merge Join. 三种不同连接的不同：
原文:https://blog.csdn.net/tianlesoftware/article/details/5826546 Nested Loops,Hash Join 和 Sort Merge ...
Nested Loop,Sort Merge Join,Hash Join
三种连接工作方式比较: Nested loops 工作方式是从一张表中读取数据,访问另一张表(通常是索引)来做匹配,nested loops适用的场合是当一个关联表比较小的时候,效率会更高. Merg ...
多表连接的三种方式详解 hash join、merge join、 nested loop
在多表联合查询的时候,如果我们查看它的执行计划,就会发现里面有多表之间的连接方式.多表之间的连接有三种方式:Nested Loops,Hash Join 和 Sort Merge Join.具体适用哪 ...
Oracle 表的连接方式(1)-----Nested loop join和 Sort merge join
关系数据库技术的精髓就是通过关系表进行规范化的数据存储,并通过各种表连接技术和各种类型的索引技术来进行信息的检索和处理. 表的三种关联方式: nested loop:从A表抽一条记录,遍历B表查找匹配 ...
三大表连接方式详解之Nested loop join和 Sort merge join
在早期版本,Oracle提供的是nested-loop join,两表连接就相当于二重循环,假定两表分别有m行和n行如果内循环是全表扫描,时间复杂度就是O(m*n) 如果内循 ...

随机推荐

jquery 通过属性选择器获取input不为disabled的对象
$("input[id^='input_001']:not(:disabled)").each(function(){ console.log(this); });
[Sdoi2013]直径（树的直径）
//36分 #include<cstdio> #include<cstdlib> #include<cstring> #include<ctime> # ...
九度OJ 1344：可乐瓶展览（DP）
时间限制:1 秒内存限制:32 兆特殊判题:否提交:430 解决:76 题目描述: 众所周知JOBDU旗下的JOBCOLA公司是文明全球的著名可乐制造商,与其它可乐公司不同的是,JOBCOLA可 ...
九度OJ 1182：统计单词（计数）
时间限制:1 秒内存限制:32 兆特殊判题:否提交:3920 解决:1443 题目描述: 编一个程序,读入用户输入的,以"."结尾的一行文字,统计一共有多少个单词,并分别输出 ...
【python】-- 模块、os、sys、time/datetime、random、logging、re
模块模块,用一堆代码实现了某个功能的代码集合. 类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合.而对于一个复杂的功能来,可能需要多个 ...
nginx-1.10.3 编译安装
1.系统环境 [root@crazy-acong ~]# cat /etc/redhat-release CentOS release 6.6 (Final) [root@crazy-acong ~] ...
QT设置TextEdit颜色
//设置textEdit颜色 QPalette palette= ui->receiveTextEdit->palette(); palette.setColor(QPalette::Ba ...
python neo4j
https://neo4j.com/developer/python/ http://debian.neo4j.org/
Data Structure Linked List: Merge Sort for Linked Lists
http://www.geeksforgeeks.org/merge-sort-for-linked-list/ #include <iostream> #include <vect ...
【leetcode刷题笔记】Distinct Subsequences
Given a string S and a string T, count the number of distinct subsequences of T in S. A subsequence ...

Nested loops、Hash join、Sort merge join（三种连接类型原理、使用要点）

Nested loops、Hash join、Sort merge join（三种连接类型原理、使用要点）的更多相关文章

随机推荐

热门专题