本人曾去某金融软件公司面试,交流中面试官问的一个问题是:“如果有 A、B 两张表,A 表中有 2 条数据,B 表中有 200 条数据,请问 SELECT * FROM A,B 能查出多少条数据?”。

听到这个问题的瞬间我就懵了,因为我自己也做过近两年的面试官,所以我首先会想的就是他问这么没有实际意义(实际开发中几乎 100% 的查询都需要条件)的问题是想考察我什么呢?同时我心里也在想,这种逗号的写法本质上就是内连接,那答案是笛卡尔积吗?我刚想对面试官说:“我没这么写过,但我分析这种写法的结果应该是笛卡尔积,也就是 2×200 等于 400……”,正在组织语言的时候被面试官打断了,他说:“没关系!我就问问!……”

现在我们来仔细研究下这个问题

首先来创建 t6、t7、t8 共 3 张表,创建语句如下:

CREATE TABLE t6 AS SELECT LEVEL f1,6 f2,0 f3 FROM DUAL CONNECT BY LEVEL<=6;
CREATE TABLE t7 AS SELECT LEVEL f1,7 f2,0 f3 FROM DUAL CONNECT BY LEVEL<=7;
CREATE TABLE t8 AS SELECT LEVEL f1,8 f2,0 f3 FROM DUAL CONNECT BY LEVEL<=8;

然后来看看各个表中的数据分步

SQL> SELECT t6.* FROM t6;

        F1         F2         F3
---------- ---------- ----------
1 6 0
2 6 0
3 6 0
4 6 0
5 6 0
6 6 0 6 rows selected SQL> SELECT t7.* FROM t7; F1 F2 F3
---------- ---------- ----------
1 7 0
2 7 0
3 7 0
4 7 0
5 7 0
6 7 0
7 7 0 7 rows selected SQL> SELECT t8.* FROM t8; F1 F2 F3
---------- ---------- ----------
1 8 0
2 8 0
3 8 0
4 8 0
5 8 0
6 8 0
7 8 0
8 8 0 8 rows selected

接下来开始我们的实验

SELECT COUNT(1) res FROM t6 JOIN t7 ON t6.f1=t7.f1; -- res: 6
SELECT COUNT(1) res FROM t6 JOIN t7 ON t6.f2=t7.f2; -- res: 0
SELECT COUNT(1) res FROM t6 JOIN t7 ON t6.f3=t7.f3; -- res: 42
SELECT COUNT(1) res FROM t6 JOIN t7 ON 1=1; -- res: 42
SELECT COUNT(1) res FROM t6 JOIN t7 ON 1=2; -- res: 0

在 t6 和 t7 两张表中:f1 字段值中的 1~6 是相等的,所以结果集行数是 6×1 等于 6;f2 字段值则完全不想等,所以结果集行数是 6×0 等于 0;f3 字段值全都相等,所以结果集行数是 6×7 等于 42。

SELECT COUNT(1) res FROM t6 LEFT JOIN t7 ON t6.f1=t7.f1; -- res: 6
SELECT COUNT(1) res FROM t6 LEFT JOIN t7 ON t6.f2=t7.f2; -- res: 6
SELECT COUNT(1) res FROM t6 LEFT JOIN t7 ON t6.f3=t7.f3; -- res: 42
SELECT COUNT(1) res FROM t6 LEFT JOIN t7 ON 1=1; -- res: 42
SELECT COUNT(1) res FROM t6 LEFT JOIN t7 ON 1=2; -- res: 6

左连接的时候,会返回左边表中的所有行,如果左边表中的行在右边表中没有匹配行,则结果集中右边表中的列返回空值。在这里,t7.f1 与 t6.f1 有 6 行唯一匹配,所以结果集行数是 6×1 等于 6;t7.f2 与 t6.f2 完全不匹配,所以结果集行数就是 6;t7.f3 中有 7 行能匹配 t6.f3 中的任意行,所以结果集行数是 6×7 等于 42。

接下来回到本文一开始提出的那个问题,先看查询结果:

SELECT COUNT(1) res FROM t6,t7; -- res: 42

事实上这是一个交叉连接(一定有人会晕倒),交叉连接的标准写法是:

SELECT COUNT(1) res FROM t6 CROSS JOIN t7; -- res: 42

也许是工作久了的原因,可能大部分人都还记得内连接和外连接(左连接、右连接、全连接),因为内链接和左连接还经常用。同时,估计大部分人和我一样,已经把三大连接中的交叉连接给忘得一干二净了,原因也很简单,长时间没用了!

交叉连接最典型的特点就是没有 WHERE 子句,交叉连接返回连接表中所有数据行的笛卡尔积,在关系数据库中的笛卡尔积的结果就是交叉连接所涉及的表中行数之积。

其实 CROSS JOIN 后面也是可以跟 WHERE 子句的,不过那样它就相当于内连接了。我觉得可以理解为不写条件就相当于条件恒等,这时的结果集行数就是两个表中数据行数的乘积,也就是所谓的笛卡尔积。

最后附上同样从来都用不到的全连接的验证结果

SELECT COUNT(1) res FROM t6 FULL JOIN t7 ON t6.f1=t7.f1; -- res: 7
SELECT COUNT(1) res FROM t6 FULL JOIN t7 ON t6.f2=t7.f2; -- res: 13
SELECT COUNT(1) res FROM t6 FULL JOIN t7 ON t6.f3=t7.f3; -- res: 42
SELECT COUNT(1) res FROM t6 FULL OUTER JOIN t7 ON 1=1; -- res: 42
SELECT COUNT(1) res FROM t6 FULL OUTER JOIN t7 ON 1=2; -- res: 13

最最后附上全连接的定义:完全外部连接返回左边表和右边表中的所有行。当某行在一个表中没有匹配行时,则另一个表中的列将包含空值。如果表之间有匹配行,则整个结果集的行包含基表的数据。

本文链接http://www.cnblogs.com/hanzongze/p/oracle-sql-rows.html

版权声明:本文为博客园博主 韩宗泽 原创,作者保留署名权!欢迎通过转载、演绎或其它传播方式来使用本文,但必须在明显位置给出作者署名和本文链接!个人博客,能力有限,若有不当之处,敬请批评指正,谢谢!

Oracle 查询结果集行数分析的更多相关文章

  1. 查询执行成本高(查询访问表数据行数多)而导致实例 CPU 使用率高是 MySQL 非常常见的问题

    MySQL CPU 使用率高的原因和解决方法_产品性能_常见问题_云数据库 RDS 版-阿里云 https://help.aliyun.com/knowledge_detail/51587.html ...

  2. Oracle查询库中记录数大于2千万的所有表

    Oracle查询库中记录数大于2千万的所有表 假如当前用户拥有select any table权限,则可以使用下列sql语句: select table_name, num_rows from dba ...

  3. MS SQL查询所有表行数,获取所有数据库名,表名,字段名

    1.获取所有数据库名 --SELECT Name FROM Master..SysDatabases ORDER BY Name -- 2.获取所有表名: --SELECT Name NAMEtemp ...

  4. 解析oracle的rownum,数据库查询结果返回行数设置

    对于rownum来说它是oracle系统顺序分配为从查询返回的行的编号,返回的第一行分配的是1,第二行是2,依此类推,这个伪字段可以用于限制查询返回的总行数,而且rownum不能以任何表的名称作为前缀 ...

  5. CI中获取读操作的结果集行数+获取写操作的影响行数

    本质:读操作,用mysql_num_rows函数,写操作用mysql_affected_rows函数 mysql_num_rows() 返回结果集中行的数目.此命令仅对 SELECT 语句有效.要取得 ...

  6. iOS开发- 查询项目代码行数

    ...事实上, 这功能也没什么用. 就是查询一个项目总的代码行数. 玩玩倒是能够. 方法: 在终端以下依次输入: cd 项目文件 find . "(" -name "*. ...

  7. Hibernate 查询sql结果行数的几种方法

    一.前言 这个东西,难度几乎没有,就是繁琐. 一条简单的select count(*) from table_name 都能有多种书写方式. 总是忘,这里记录下. 一 .通过Criteria 查询 C ...

  8. oracle:ORACLE 实际返回的行数超出请求的行数

    写的存储过程,执行后一直报实际返回的行数超出请求的行数的错误. 原因:select prdt_id into prdt_id from.... 两个变量名称相同造成的..哎  第一个变量换成大写..问 ...

  9. ORACLE 查询不走索引的原因分析,解决办法通过强制索引或动态执行SQL语句提高查询速度

    (一)索引失效的原因分析: <>或者单独的>,<,(有时会用到,有时不会) 有时间范围查询:oracle 时间条件值范围越大就不走索引 like "%_" ...

随机推荐

  1. 畅通工程续 -- HDU 1874 floyd

    题目大意: 现在,已知起点和终点,请你计算出要从起点到终点,最短需要行走多少距离. 思路: floyd算法模板题,这是一个牺牲空间换取时间的算法,本质是动态规划. AC代码: #include < ...

  2. CSS水平垂直居中!

    总结一下,最经典的面试题 分两种情况,宽高确定和不定宽高 (一)宽高确定 初始条件如下: 1. 绝对定位 + 负margin 里面的盒子相对于父盒子绝对定位,距离上面和左边分别为50%,此处的50%是 ...

  3. 可视化利器Visdom

    可视化利器Visdom 最近在使用Pytorch炼丹,单纯地看命令行输出已经无法满足调试的需求,尝试了facebook开源的visdom,感觉非常优雅,支持numpy和torch 安装 $ pip i ...

  4. vue 格式化银行卡(信用卡)每4位一个符号隔断

    问题 在做银行卡输入框时有一个需求如题,这里举例用-隔断 调查 查看了很多大公司网站的银行卡输入,发现还有有很多缺陷的: 有的是在中间删除,光标会跳到最后: 有的是能删除掉中间隔断符的: 等等,逻辑感 ...

  5. java常用数据类型使用Day008

    1,java常用数据类型使用 package cn.edu.fhj.day008; import java.util.ArrayList; import java.util.HashMap; impo ...

  6. iis 和 node express 共用80端口 iisnode 全过程

    一.首先下载iisnode.exe https://github.com/tjanczuk/iisnode/wiki/iisnode-releases  链接 安装完毕! 二.打开IIS 7 选中 D ...

  7. remote: HTTP Basic: Access denied fatal: Authentication failed for'https'

    问题原因: 重置了密码导致git操作失败. 解决方案: 输入:git config --system --unset credential.helper 再次进行git操作,输入用户名,密码.

  8. SQL Server 删除重复记录,只保留一条记录

    原文地址:http://blog.csdn.net/eriato/article/details/17417303 有张表格之前没有设计关键字段的唯一约束,导致有时候执行插入操作时不小心执行了多次就出 ...

  9. JetBrains系列IDE快捷键大全(转载)

    编辑 快捷键组合 说明 Ctrl + Space 代码自动完成提示(选择) Alt + Enter 显示意图动作和快速修复 Ctrl + P 参数信息 (在调用方法参数忘记的时候,提示) Ctrl + ...

  10. python elasticsearch 批量写入数据

    from elasticsearch import Elasticsearch from elasticsearch import helpers import pymysql import time ...