oracle中的exists 和 in 用法详解

以前一直不知道exists和in的用法与效率，这次的项目中需要用到，所以自己研究了一下。下面是我举两个例子说明两者之间的效率问题。

前言概述：

“exists”和“in”的效率问题，涉及到效率问题也就是sql优化：

1.若子查询结果集比较小，优先使用in。

2.若外层查询比子查询小，优先使用exists。原理是：若匹配到结果，则退出内部查询并将条件标志为true，传回全部结果资料

因为若用in，则oracle会优先查询子查询，然后匹配外层查询，原理是：in不管匹配到匹配不到都全部匹配完毕,匹配相等就返回true，就会输出一条元素.

若使用exists，则oracle会优先查询外层表，然后再与内层表匹配

也就是：”匹配原则，拿最小记录匹配大记录。也就是遍历的次数越少越好"

例子如下：

1) select * from T_USER1 where exists(select 1 from T_USER2 where T_USER1.jxb_id =T_USER2.jxb_id ) ;

T_USER1 数据量小而T_USER2 数据量非常大时，T_USER1 <<T_USER2 时，1) 的查询效率高。

原理解析：以上查询使用了exists语句,sql语句如：select a.* from A a where exists(select 1 from B b where a.id=b.id)

exists()会执行A.length次,它并不缓存exists()结果集,因为exists()结果集的内容并不重要,重要的是结果集中是否有记录,如果有则返回true,没有则返回false.
它的查询过程类似于以下过程：

 List resultSet=[];

 Array A=(select * from A)

 for(int i=0;i<A.length;i++) {        //这个循环次数越少越好

    if(exists(A[i].id) {    //执行select 1 from B b where b.id=a.id是否有记录返回

        resultSet.add(A[i]);

    }

 }

 return resultSet;

当B表比A表数据大时适合使用exists(),因为它没有那么遍历操作,只需要再执行一次查询就行.
如:A表有10000条记录,B表有1000000条记录,那么exists()会执行10000次去判断A表中的id是否与B表中的id相等.
如:A表有10000条记录,B表有100000000条记录,那么exists()还是执行10000次,因为它只执行A.length次,可见B表数据越多,越适合exists()发挥效果

再如:A表有10000条记录,B表有100条记录,那么exists()还是执行10000次,还不如使用in()遍历10000*100次,因为in()是在内存里遍历比较,而exists()需要查询数据库,我们都知道查询数据库所消耗的性能更高,而内存比较很快.

2) select * from T_USER1 where T_USER1.jxb_id in (select T_USER2 .jxb_id from T_USER2 ) ;

T_USER1 数据量非常大而T_USER2数据量小时，T_USER1 >>T_USER2时，2) 的查询效率高。

原理解析：这里有条SQL语句：select * from A where id in(select id from B)

以上查询使用了in语句,in()只执行一次,它查出B表中的所有id字段并缓存起来.之后,检查A表的id是否与B表中的id相等,如果相等则将A表的记录加入结果集中,直到遍历完A表的所有记录;

它的查询过程类似于以下过程

List resultSet=[];

Array A=(select * from A);

Array B=(select id from B);

for(int i=0;i<A.length;i++) {

   for(int j=0;j<B.length;j++) {

      if(A[i].id==B[j].id) {

         resultSet.add(A[i]);

         break;

      }

   }

}

return resultSet;

可以看出,当B表数据较大时不适合使用in(),因为它会B表数据全部遍历一次.
如:A表有10000条记录,B表有1000000条记录,那么最多有可能遍历10000*1000000次,效率很差.
再如:A表有10000条记录,B表有100条记录,那么最多有可能遍历10000*100次,遍历次数大大减少,效率大大提升.

=======================================================================================================

详解上面的用法：

exists 用法：

其中 “select 1 from T_USER2 where T_USER1.jxb_id =T_USER2.jxb_id” 相当于一个关联表查询，相当于

“select 1 from T_USER1,T_USER2 where T_USER1.jxb_id=T_USER2.jxb_id”

这种情况下不能单独执行select 1那部分的sql,不然会报语法错误的，这也是使用exists需要注意的地方。

“exists（xxx）”就表示括号里的语句能不能查出记录，它要查的记录是否存在。

因此“select 1”这里的 “1”其实是无关紧要的，换成“*”也没问题，它只在乎括号里的数据能不能查找出来，是否存在这样的记录，如果存在，这 1）句的where 条件成立。

==============================

in 的用法：

“2) select * from T_USER1 where T_USER1.jxb_id in (select T_USER2 .jxb_id from T_USER2 ) ;

这里的“in”后面括号里的语句搜索出来的字段的内容一定要相对应，一般来说，T1和T2这两个表的a字段表达的意义应该是一样的，否则这样查没什么意义。注意：两个字段名称可以不同，但是代表的东西一定是一样的才可以。

打个比方：T1，T2表都有一个字段，表示工单号，但是T1表示工单号的字段名叫“ticketid”，T2则为“id”，但是其表达的意义是一样的，而且数据格式也是一样的。这时，用 2）的写法就可以这样：

 “select * from T1 where T1.ticketid in (select T2.id from T2) ”

 Select name from employee where name not in (select name from student);

 Select name from employee where not exists (select name from student);

第一句SQL语句的执行效率不如第二句。

总结：

通过使用EXISTS，Oracle会首先检查主查询，然后运行子查询直到它找到第一个匹配项，这就节省了时间。

Oracle在执行IN子查询时，首先执行子查询，并将获得的结果列表存放在一个加了索引的临时表中。在执行子查询之前，系统先将主查询挂起，待子查询执行完毕，存放在临时表中以后再执行主查询。

这也就是使用EXISTS比使用IN通常查询速度快的原因

oracle中的exists 和 in 用法详解的更多相关文章

教程-Delphi中Spcomm使用属性及用法详解
Delphi中Spcomm使用属性及用法详解 Delphi是一种具有功能强大.简便易用和代码执行速度快等优点的可视化快速应用开发工具,它在构架企业信息系统方面发挥着越来越重要的作用,许多程序员愿意选 ...
js数组中foEach和map的用法详解 jq中的$.each和$.map
数组中foEach和map的用法详解相同点: 1.都是循环遍历数组(仅仅是数组)中的每一项. 2.forEach() 和 map() 里面每一次执行匿名函数都支持3个参数:数组中的当前项value, ...
centos中crontab（计时器）用法详解
关于crontab: crontab命令常见于Unix和类Unix的操作系统之中,用于设置周期性被执行的指令.该命令从标准输入设备读取指令,并将其存放于“crontab”文件中,以供之后读取和执行.该 ...
Apache中的Order Allow,Deny用法详解
本文讲述了Apache中的Order Allow,Deny用法.分享给大家供大家参考,具体如下: Allow和Deny可以用于apache的conf文件或者.htaccess文件中(配合Directo ...
oracle中的exists和not exists和in用法详解
in 是把外表和内表作hash 连接,而exists是对外表作loop循环,每次loop循环再对内表进行查询. not exists:做NL,对子查询先查,有个虚表,有确定值,所以就算子查询有NULL ...
Java 中 this 和 super 的用法详解
前言这次我们来回顾一下this和super这两个关键字的用法,作为一名Java程序员,我觉得基础是最重要的,因为它决定了我们的上限,所以我的文章大部分还是以分享Java基础知识为主,学好基础,后面的 ...
Oracle层级询语句connect by 用法详解
如果表中包含层级数据,那么你就可以使用层级查询从句选择行层级顺序. 1.层级查询从句语法层级查询从句语法: { CONNECT BY [ NOCYCLE ] condition [AND condi ...
AngularJS中$timeout和$interval的用法详解
1. 先将$interval,$timeout,作为参数注入到controller中,例如rds.controller('controllerCtrl', ['app', '$scope','$htt ...
[转]AngularJS中$timeout和$interval的用法详解
本文转自:http://www.cnblogs.com/moli-/p/5827618.html 1. 先将$interval,$timeout,作为参数注入到controller中,例如rds.co ...

随机推荐

Java 工程师成神之路 | 2019正式版
本文为转载,原文见以下链接:https://mp.weixin.qq.com/s/4AMzq87V6eW3YPgE0mCdSw 1 基础篇 01 面向对象 → 什么是面向对象面向对象.面向过程面向 ...
C#类与结构体的小结
1.定义不同类使用class关键字来定义: 结构体用struct: 2.使用时的注意事项 ->结构体是值类型,类是引用类型 ->结构体中声明的变量不能做赋值操作,但是类可以. -> ...
tomcat安装启动之后localhost：8080页面进不去，提示错误500
具体的错误展示页面如下: 首先,需要考虑到是不是安装的tomcat版本和自己安装的jdk的版本一致,如果不一致,建议将tomcat换成和jdk一致或者高于jdk版本的tomcat版本.(比如安装的jd ...
团队第四次 # scrum meeting
github 本此会议项目由PM召开,召开时间为4-8日晚上10点召开时长15分钟任务表格袁勤负责编写登陆逻辑 https://github.com/buaa-2016/phyweb/issu ...
vue+axios完美实现前端路由拦截
一.路由拦截 1.首先在router的index.js里配置一个自定义字段requireAuth,用该字段来判断进入该路由是否需要登录.如果已经登陆则进入该路由,反之则进入登录页面. 如图是路由配置: ...
Spark启动报错|java.io.FileNotFoundException: File does not exist: hdfs://hadoop101:9000/directory
at org.apache.spark.deploy.history.FsHistoryProvider.<init>(FsHistoryProvider.scala:) at org.a ...
装python package 时，conda提示会升级python2到python3，那可能是你的windows不支持py2env下的此包。
装python package 时,conda提示会升级python2到python3, 那可能是你的windows不支持py2env下的此包.比如:win 下,tensorflow就不支持py2的环 ...
Win10 安装SqlServer2012 无法访问数据库
win10系统,安装好vs2017,sqlserver2012, 在abp 执行 Update-Database 会出错具体解决办法是SqlServer2012的1433端口没打开. 打开办 ...
GDI+ 或 GdiPlus 在VC6下的使用方法
1.在你的app类头文件中假如以下代码(红字显示) #if !defined(AFX_WALKLTDEMO_H__826A807C_C01D_4FF0_9248_A6BD0369F3A8__INCLU ...
SpringCloud系列七：Hystrix 熔断机制（Hystrix基本配置、服务降级、HystrixDashboard服务监控、Turbine聚合监控）
1.概念:Hystrix 熔断机制 2.具体内容所谓的熔断机制和日常生活中见到电路保险丝是非常相似的,当出现了问题之后,保险丝会自动烧断,以保护我们的电器, 那么如果换到了程序之中呢? 当现在服务的 ...

oracle中的exists 和 in 用法详解

oracle中的exists 和 in 用法详解的更多相关文章

随机推荐

热门专题