Oracle表连接

一个普通的语句select * from t1, t2 where t1.id = t2.id and t1.name = 'a'; 这个语句在什么情况下最高效？

表连接分类：

1. 嵌套循环连接(Nested Loop Join)

2. 排序合并连接(Merge Sort Join)：PGA 中的 SORT_AREA_SIZE 控制

3. 哈希连接(Hash Join)：PGA中的HASH_AREA_SIZE控制

示例(基本均是在sql*plus环境下执行)：

-- 准备脚本

prompt 准备实验环境.....

drop table t1 cascade constraints purge;

drop table t2 cascade constraints purge;

create table t1(

id number not null,

n number,

contents varchar2(4000)

);

create table t2(

id number not null,

t1_id number not null,

n number,

contents varchar2(4000)

);

execute dbms_random.seed(0);

insert into t1

(

id,

contents

)

select rownum,

rownum,

dbms_random.string('a', 50)

from dual

connect by level <= 100

order by dbms_random.random;

insert into t2

(

id,

t1_id,

contents

)

select rownum,

rownum,

dbms_random.string('b', 50)

from dual

connect by level <= 100000

order by dbms_random.random;

commit;

-- 修改统计参数为ALL

alter system set statistics_level=all;

-- alter session set statistics_level=all; 会话级修改，偶尔失效

show parameter statistics_level;

set linesize 1000

-- 实验开始

-- NL连接表

-- 1.1 HINT含义 leading(t1)表示强制先访问t1表，也就是t1表作为驱动表；use_nl表示强制用嵌套循环连接方式

select /*+leading(t1) use_nl(t2)*/ * from t1, t2 where t1.id = t2.t1_id;

select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

starts列是表访问的次数，t1表访问了1次，t2表访问了100次

-- 1.2

select /*+leading(t1) use_nl(t2)*/ * from t1, t2 where t1.id = t2.t1_id and t1.n in (19, 20);

select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

t1表访问了1次，t2表访问了2次

-- 1.3

select /*+leading(t1) use_nl(t2)*/ * from t1, t2 where t1.id = t2.t1_id and t1.n = 19;

select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

t1表访问了1次，t2表访问了1次

-- 1.4

select /*+leading(t1) use_nl(t2)*/ * from t1, t2 where t1.id = t2.t1_id and t1.n = 9999999;

select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

t1表访问了1次，t2表访问了0次

NL表连接访问次数最终结论：t1表的查询返回多少条记录，t2表就访问多少次。也就是，在嵌套循环连接中，驱动表返回多少条记录，被驱动表就访问多少次。

--2. 哈希连接表

-- 2.1

select /*+leading(t1) use_hash(t2)*/ * from t1, t2 where t1.id = t2.t1_id;

select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

t1 1次, t2 1次

在HASH连接中，驱动表和被驱动表都只会访问1次或0次

-- 2.2

select /*+leading(t1) use_hash(t2)*/ * from t1, t2 where t1.id = t2.t1_id and t1.n = 9999999;

select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

t1 1次，t2 0次

-- 2.3

select /*+leading(t1) use_hash(t2)*/ * from t1, t2 where t1.id = t2.t1_id and 1 = 2;

select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

t1 0次, t2 0次

-- 3. 排序合并连接

select /*+ordered use_merge(t2)*/ * from t1, t2 where t1.id = t2.t1_id;

select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

t1 1次, t2 1次

假设两张表，A和B，如果A作为驱动表，B作为被驱动表，那么，嵌套循环连接，就是先扫描A表，对A表的每一条记录，都扫描一遍B表；

而排序合并连接是 A表跟B表内的记录同时排序，然后连接; 哈希连接,类似排序合并，建立哈希表来连接。所以当返回少量记录的时候(OLTP系统常用，OLTP多用于电信、金融等系统)，嵌套循环连接更高效，而返回大量记录的时候，排序合并连接跟哈希连接更高效。

各类连接驱动顺序区别

1.嵌套循环连接

select /*+leading(t1) use_nl(t2)*/ * from t1, t2 where t1.id = t2.t1_id and t1.n = 19;

select /*+leading(t2) use_nl(t1)*/ * from t1, t2 where t1.id = t2.t1_id and t1.n = 19;

select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

t1表先访问：BUFFER 1014，t2只访问1次

t2表先访问：BUFFER 701K，t1被访问100000次

所以，嵌套循环连接要特别注意驱动表的顺序，小的结果集先访问，大的结果集后访问

2. 哈希连接

select /*+leading(t1) use_hash(t2)*/ * from t1, t2 where t1.id = t2.t1_id and t1.n = 19;

select /*+leading(t2) use_hash(t1)*/ * from t1, t2 where t1.id = t2.t1_id and t1.n = 19;

select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

t1表先访问：BUFFER 1013，Used_Mem 286K，时间0.04秒

t2表先访问：BUFFER 1013，Used_Mem 11MB，时间0.01秒

在哈希连接中，驱动表顺序也很重要

3.排序合并连接

select /*+leading(t1) use_merge(t2)*/ * from t1, t2 where t1.id = t2.t1_id and t1.n = 19;

select /*+leading(t2) use_merge(t1)*/ * from t1, t2 where t1.id = t2.t1_id and t1.n = 19;

select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

无论先访问t1还是先访问t2，效率都一样，执行时间，BUFFER,USED_MEM都一样，这表明，排序合并连接没有驱动表概念。

综上所述：嵌套循环连接和哈希连接有驱动顺序，驱动表的顺序不同将影响表连接的性能；而排序合并连接没有驱动的概念，无论哪张表在前都无妨。

嵌套循环连接不需要排序；哈希连接并不排序，消耗内存是用于建议HASH表；排序合并连接需要排序。关于哈希连接和排序合并连接，不要取多余的字段参与排序，因为选择的字段越少，消耗内存的尺寸就越小。

select /*+leading(t2) use_merge(t1)*/ * from t1, t2 where t1.id = t2.t1_id and t1.n = 19;

select /*+leading(t2) use_merge(t1)*/ t1.id from t1, t2 where t1.id = t2.t1_id and t1.n = 19;

select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

可以看出Used_Mem代表的内存消耗差别很大

各类连接限制场景

explain plan for

select /*+leadind(t1) use_hash(t2)*/ *

from t1, t2

where t1.id <> t2.t1_id and t1.n = 19;

select * from table(dbms_xplan.display);

没有按照HINT的提示走HASH连接，而是走了NL连接

同理，可以试验> 、 < 、like，HASH都不支持。

explain plan for

select /*+leadind(t1) use_merge(t2)*/ *

from t1, t2

where t1.id <> t2.t1_id and t1.n = 19;

select * from table(dbms_xplan.display);

排序合并连接不支持<>和Like，但是支持>、<

嵌套循环无限制

表连接与索引

select /*+leading(t1) use_nl(t2)*/ * from t1, t2 where t1.id = t2.t1_id;

select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

如果不使用HINT提示

select * from t1, t2 where t1.id = t2.t1_id;

select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

会显示走的是HASH连接，因为ORACLE认为HASH连接更合理，但是此时逻辑读,COST值都差不多

create index t1_n on t1(n);

再执行上述语句，看看扫描t1表时BUFFER的差别

create index t2_t1_id on t2(t1_id);

再执行上述语句，看看扫描t2表时BUFFER的差别

最适合NL连接的场景：

1. 两表关联返回的记录不多，最佳情况是驱动结果集仅返回1条或少量几条记录，而被驱动表仅匹配到1条或少量几条记录，这种情况，即便t1和t2表的记录奇大无比，也是非常迅速的。

2. 遇到一些不等值查询导致哈希和排序合并连接被限制使用，不得不使用NL连接。

3.最佳的索引建立位置：驱动表的限制条件所在列有索引，被驱动表的连接条件所在列有索引。原因在于，驱动表的限制条件建立索引是为了缩小扫描驱动表的时间，如果在驱动表的连接条件建立索引就没有任何意义了，所有列关联到另一个表的所有列，等同于每一条记录都要关联。而驱动表的限制条件建立了索引，只快速返回1条或几条，然后再等传递给t2表的t1_id列，一般情况下，t2表对应t1表返回的记录并不多，所以t2表的t1_id列建索引是有意义的。

哈希连接与索引

连接条件的索引对哈希连接和排序合并连接起不到传递作用，对于哈希连接和排序合并连接来说，索引的连接条件建立索引起不到快速检索的作用，但是限制条件列如果有适合的索引可以快速检索到少量记录，还是可以提升性能的。

两表关联等值查询，ORACLE一般倾向于走HASH连接，因为HASH连接算法本身比较高效，也比较先进。优化HASH连接可以通过调整PGA中的HASH_AREA_SIZE来优化，如果PGA是自动管理的，那么就增大PGA的大小。

排序合并连接与索引

排序合并连接上的连接条件虽然没有检索作用，但是有消除排序的作用，因此可以提高效率。

SQL>select /*+ordered use_merge(t2)*/

from t1, t2

where t1.id = t2.t1_id;

SQL>select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

create index idx_t1 on t1(id);

create index idx_t1_id on t2(t1_id); -- 上面建立过

SQL>select /*+ordered use_merge(t2)*/

from t1, t2

where t1.id = t2.t1_id;

SQL>select * from table(dbms_xplan.display_cursor(null, null, 'allstats last'));

建了两个索引，最终只用到了一个，这是ORACLE排序合并连接的BUG，在11G官方文档里有承认。

也可以通过增大PGA，优化排序合并连接

Oracle表连接的更多相关文章

oracle表连接------>排序合并连接(Merge Sort Join)
排序合并连接 (Sort Merge Join)是一种两个表在做连接时用排序操作(Sort)和合并操作(Merge)来得到连接结果集的连接方法. 对于排序合并连接的优缺点及适用场景例如以下: a,通常 ...
oracle表连接的优化
多表连接的三种方式: HASH JOIN,MERGE JOIN,NESTED LOOP NESTED LOOP: 嵌套循环连接,适用于内表数据量较小时.外表返回的每一行都要在内表中检索找到与它匹配的行 ...
Oracle 表连接
Oracle 表之间的连接分为三种: 1. 内连接(自然连接) 2. 外连接 (1)左外连接 (左边的表不加限制) (2)右外连接(右边的表不加限制) (3)全外连接(左右两表都不 ...
Oracle 表连接方式分析 .
一引言数据仓库技术是目前已知的比较成熟和被广泛采用的解决方案,用于整和电信运营企业内部所有分散的原始业务数据,并通过便捷有效的数据访问手段,可以支持企业内部不同部门,不同需求,不同层次的用户随时获 ...
ORACLE 表连接详解
在ORACLE中,表连接方式主要有:内连接,外连接,自连接: 内连接: 这是最常用的连接查询 SELECT * FROM A INNER JOIN B ON A.ID=B.ID SELECT * FR ...
Oracle表连接总结
1 简述 1) 两个表的连接,是通过将一个表中的一列或者多列同另一个表中的列链接而建立起来的.用来连接两张表的表达式组成了连接条件.当连接成功后,第二张表中的数据就同第一张表连接起来了,并形成了复合结 ...
oracle 表连接 - hash join 哈希连接
一. hash 连接(哈希连接)原理指的是两个表连接时, 先利用两表中记录较少的表在内存中建立 hash 表, 然后扫描记录较多的表并探測 hash 表, 找出与 hash 表相匹配的行来得到结果集 ...
知识点：Oracle+表连接方式(内连接-外连接-自连接)+详解来自百度文库
Oracle 表之间的连接分为三种: 1. 内连接(自然连接) 2. 外连接 (1)左外连接 (左边的表不加限制) (2)右外连接(右边的表不加限制) (3)全外连接(左右 ...
Oracle表连接（转）
表之间的连接 Join是一种试图将两个表结合在一起的谓词,一次只能连接2个表,表连接也可以被称为表关联.在后面的叙述中,我们将会使用”row source”来代替”表”,因为使用row source更 ...

随机推荐

求教。。为什么加载到servlet页面显示空白或者一直加载页面没显示也没错误？
package com.bean; public class Example7_2_Bean { String[] columnName;// 存放列名 String[][] tableRecord ...
android-partition分析
转载请注明来源:cuixiaolei的技术博客这里讲下android的分区.具体的使用在另一片文章中介绍,这里只是把它拿出来介绍. android的存储分为两种一种叫做RAM,如emmc标准的dd ...
[改善Java代码]不同的列表选择不同的遍历方法
一.场景: 我们来看一个场景,统计一个省的各科高考科目考试的平均分. 当然使用数据库中的一个SQL语句就能求出平均值,不过这个不再我们的考虑之列,这里只考虑使用纯Java的方式来解决.(由于我的机器配 ...
Oracle创建表空间、新建用户和授权
通过pl/sql以sys用户登录到Oracle数据库上,然后执行菜单:文件/新建/命令窗口 ,打开一个命令窗口然后在该命令窗口中执行脚本创建和删除表空间 . 1.创建表空间格式: create t ...
Linux - 硬链接与软链接
在 Linux 的文件系统中,磁盘块分成了 3 个部分.一部分称为数据区,用来存放文件内容.另一部分称为 inode 表,用来存放文件属性.第三部分称为超级块,用来存放文件系统本身的属性.文件的内容和 ...
小生功能贴<一> --- 动态添加应用具有长按删除功能
---恢复内容开始--- 动态添加应用具有长按删除功能功能如下图: (图片显示功能不是你要的,那就默默关闭页面吧) 设计思路: 页面一:用girdview网格显示图标 ...
Jquery选择器讲解
在Dom 编程中我们只能使用有限的函数根据id 或者TagName 获取Dom 对象. 然而在jQuery 中则完全不同,jQuery 提供了异常强大的选择器用来帮助我们获取页面上的对象, 并且将对象 ...
PLSQL插入数据中文乱码的问题
PLSQL插入数据中文乱码的问题中文乱码就是编码不统一所导致的了,解决办法只需要把编码统一下即可解决了. 具体操作步骤如下: 1.查看服务器端编码 select userenv('language' ...
Unity User Group 北京站图文报道：《Unity3D VR游戏与应用开发》
很高兴,能有机会回报Unity技术社区:我和雨松MOMO担任UUG北京站的负责人, 组织Unity技术交流和分享活动. 本次北京UUG活动场地–微软大厦成功的UUG离不开默默无闻的付出:提前2小时到 ...
第二篇、倾力总结40条常见的移动端Web页面问题解决方案
1.安卓浏览器看背景图片,有些设备会模糊. 用同等比例的图片在PC机上很清楚,但是手机上很模糊,原因是什么呢? 经过研究,是devicePixelRatio作怪,因为手机分辨率太小,如果按照分辨率 ...

Oracle表连接

Oracle表连接的更多相关文章

随机推荐

热门专题