Oracle中NULL值与索引
NULL值是关系数据库系统布尔型(true,false,unknown)中比较特殊类型的一种值,通常称为UNKNOWN或空值,即是未知的,不确定的。由于NULL存在着无数的可能,因此NULL值也不等于NULL值,所以与NULL值相关的操作同样都为NULL值。正是基于这样一个特性,对于NULL值列上的B树索引导致了is null/is not null不走索引的情形,下面描述了NULL值与索引以及索引NULL列上的执行计划,如何使得NULL值走索引的情形。注:本文仅仅讨论的是B树索引上的NULL值,位图索引不在此范围之内。
一、null值与索引
SQL> create table test(id number(2),name varchar2(10),age number(2));
SQL> create unique index test_id_ind on test(id);
//id上存在唯一索引,但由于null值不等于null值,因此能成功插入
SQL> insert into test(id,name,age) values(null,'test1',10);
SQL> insert into test(id,name,age) values(null,'test2',10);
SQL> commit;
//在test表上创建唯一复合索引,基于id,name列
SQL> create unique index test_id_name_ind on test(id,name);
//基于多列的复合索引,不全为null的重复行则不能被插入
SQL> insert into test(id,name,age) values(null,'test1',20);
insert into test(id,name,age) values(null,'test1',20)
*
第 1 行出现错误:
ORA-00001: 违反唯一约束条件 (SCOTT.TEST_ID_NAME_IND)
//(null,null)不等同于(null,null),所以的两次null能够被插入。
SQL> insert into test(id,name,age) values(null,null,20);
SQL> insert into test(id,name,age) values(null,null,20);
SQL> commit;
SQL> select * from test;
ID NAME AGE
---------- ---------- ----------
test1 10
test2 10
20
20
SQL> exec dbms_stats.gather_table_stats('scott','test',cascade=>true);
//注意:虽然我们建表时使用了"test"小写表名,但因为表名以大写存储,所以此时应该使用"TEST"
SQL> select index_name,index_type,num_rows,status,distinct_keys from user_indexes where table_name='TEST';
INDEX_NAME INDEX_TYPE NUM_ROWS STATUS DISTINCT_KEYS
------------------ ------------ ---------- -------- -------------
TEST_ID_IND NORMAL 0 VALID 0
TEST_ID_NAME_IND NORMAL 2 VALID 2
二、null值与执行计划
SQL> set autotrace traceonly;
由于null值是不被存储,所以当使用id is null作为谓词时,走了全表扫描
SQL> select * from test where id is null;
--------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 3 | 21 | 3 (0)| 00:00:01 |
|* 1 | TABLE ACCESS FULL| TEST | 3 | 21 | 3 (0)| 00:00:01 |
--------------------------------------------------------------------------
尽管当前表上id列上的所有值都为null,但不排除后续记录插入的id不为null的列。所以当使用id is not null作为谓词时,此时执行计划中走了索引全扫描。
SQL> select * from test where id is not null;
------------------------------------------------------------
| Id | Operation | Name | Rows |
------------------------------------------------------------
| 0 | SELECT STATEMENT | | 1 |
| 1 | TABLE ACCESS BY INDEX ROWID| TEST | 1 |
|* 2 | INDEX FULL SCAN | TEST_ID_IND | 1 |
------------------------------------------------------------
对于复合唯一索引的情形,当使用单列且非前导列谓词时,使用is null与 is not null等同于单列唯一索引的情形。name is null走全表扫描而name is not null走索引。
SQL> select * from test where name is null;
--------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
--------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 1 | 7 | 3 (0)| 00:00:01 |
|* 1 | TABLE ACCESS FULL| TEST | 1 | 7 | 3 (0)| 00:00:01 |
--------------------------------------------------------------------------
SQL> select * from test where name is not null;
------------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes |
------------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 2 | 14 |
| 1 | TABLE ACCESS BY INDEX ROWID| TEST | 2 | 14 |
|* 2 | INDEX FULL SCAN | TEST_ID_NAME_IND | 1 | |
------------------------------------------------------------------------
//下面看看两个列都作为谓词的情形
尽管两个谓词列上都存在索引,一个为单列唯一索引,一个为复合唯一索引。Oracle 选择了复合索引test_id_name_ind。
SQL> select * from test where id is null and name is not null;
----------------------------------------------------------------
| Id | Operation | Name | Rows |
----------------------------------------------------------------
| 0 | SELECT STATEMENT | | 2 |
| 1 | TABLE ACCESS BY INDEX ROWID| TEST | 2 |
|* 2 | INDEX RANGE SCAN | TEST_ID_NAME_IND | 1 |
----------------------------------------------------------------
谓词的顺序与复合索引定义的顺序一样,第一个谓词为id is not null,而第二个谓词为name is null。此时Oracle 选择了单列唯一索引test_id_ind。
SQL> select * from test where id is not null and name is null;
-------------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes |
-------------------------------------------------------------------
| 0 | SELECT STATEMENT | | 1 | 7 |
|* 1 | TABLE ACCESS BY INDEX ROWID| TEST | 1 | 7 |
|* 2 | INDEX FULL SCAN | TEST_ID_IND | 1 | |
-------------------------------------------------------------------
三、is null走索引
SQL> set autot off;
SQL> delete from test where name is null;
SQL> select * from test;
ID NAME AGE
---------- ---------- ----------
test1 10
test2 10
SQL> update test set id=1 where name='test1';
SQL> update test set id=2 where name='test2';
SQL> commit;
SQL> alter table test modify id not null;
SQL> set autot trace exp;
SQL> select * from test where id is null;
----------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes | Cost (%CPU)|
----------------------------------------------------------------
| 0 | SELECT STATEMENT | | 1 | 7 | 0 (0)|
|* 1 | FILTER | | | | |
| 2 | TABLE ACCESS FULL| TEST | 3 | 21 | 3 (0)|
----------------------------------------------------------------
//组合索引中,第一个字段没有出现在where语句中,此时走INDEX SKIP SCAN
SQL> select * from test where name is null;
----------------------------------------------------------------
| Id | Operation | Name | Rows |
----------------------------------------------------------------
| 0 | SELECT STATEMENT | | 1 |
| 1 | TABLE ACCESS BY INDEX ROWID| TEST | 1 |
|* 2 | INDEX SKIP SCAN | TEST_ID_NAME_IND | 1 |
----------------------------------------------------------------
SQL> insert into test(id,name,age) values(3,null,30);
SQL> commit;
SQL> exec dbms_stats.gather_table_stats('scott','TEST',cascade=>true);
SQL> select index_name,index_type,num_rows,status,distinct_keys from user_indexes where table_name='TEST';
INDEX_NAME INDEX_TYPE NUM_ROWS STATUS DISTINCT_KEYS
------------------ ----------- ------------ -------- -------------
TEST_ID_IND NORMAL 3 VALID 3
TEST_ID_NAME_IND NORMAL 3 VALID 3
四、通过基于函数的索引来使得is null使用索引
SQL> create table test2(id number(2),name varchar2(10));
//用nvl函数来创建函数索引,即当obj_id为null值时,存储-1
SQL> create index test2_fn_ind on test2(nvl(id,-1));
SQL> select count(*) from test2 where nvl(id,-1)=-1;
---------------------------------------------------------
| Id | Operation | Name | Rows | Bytes |
---------------------------------------------------------
| 0 | SELECT STATEMENT | | 1 | 13 |
| 1 | SORT AGGREGATE | | 1 | 13 |
|* 2 | INDEX RANGE SCAN| TEST_FN_IND | 1 | 13 |
---------------------------------------------------------
五、使用伪列创建基于函数的索引来使得is null使用索引
//通过添加一个值为-1(可取任意值)的伪列来创建索引
SQL> create index test2_new_id_ind on test2(id,-1);
SQL> select count(*) from test2 where id is null;
-------------------------------------------------------------
| Id | Operation | Name | Rows | Bytes |
-------------------------------------------------------------
| 0 | SELECT STATEMENT | | 1 | 13 |
| 1 | SORT AGGREGATE | | 1 | 13 |
|* 2 | INDEX RANGE SCAN| TEST_NEW_ID_IND | 1 | 13 |
-------------------------------------------------------------
四、总结
无论是单列唯一索引或复合唯一索引,对于可以为null的列或复合null值,Oracle不会为其存储索引值。故在基于单列创建B树唯一索引或多列创建B树复合唯一索引的情形下,
当列上允许为null值时:
where子句使用了基于is null的情形,其执行计划走全表扫描。
where子句使用了基于is not null的情形,其执行计划走索引扫描。
当列上不允许为null值时,存在非null约束:
where子句使用了基于is null的情行,其执行计划走索引扫描。
where子句使用了基于is not null的情形,其执行计划走索引扫描。
Null与索引使用时的建议:
1、对于用于连接或经常被谓词使用到的列应尽可能避免NULL值属性,因为它容易导致索引失效。
2、为需要使用NULL值的列添加缺省值(alter table tb modify(col default 'Y'))。
3、如果NULL值不可避免也不能使用缺省值,应考虑为该常用列使用nvl函数创建索引,或使用伪列来创建索引以提高查询性能。
4、对于复合索引应保证索引中至少有一列不为NULL值,还是因为全部列为NULL时不被索引存储,以保证使用is null是可以使用索引。
5、对于复合索引应保证索引列应使用数据类型长度最小的列来添加not null约束应节省磁盘空间。
Oracle中NULL值与索引的更多相关文章
- 细说Oracle中NULL值
1.NULL是什么? NULL表示UNKNOW(未知),其不代表不论什么值. 比如一行中某列没有不论什么值即为NULL. ORACLE同意不论什么一种数据类型的字段为空,除了下面两种情况: 1)主键字 ...
- 问题:oracle 排序 null值放在最后;结果: ORACLE中null的排序问题
ORACLE中null的排序问题 关键字: oracle nulls 问题描述: 在平时的业务处理中,经常遇到要对业务数据进行排序,并且要对null值也做相应的排序.在Oracle中,进行Ord ...
- 【Oracle】Oracle 的过程化SQL(PLSQL)中NULL值的处理
下面是NULL的几个注意点: 1.NULL值既不是空格也不是0. 2.给表插入值的时候,如果没有给列指定列值,则默认为NULL. 3.当算术表达式里包含NULL值时,其计算结果也是NULL值. 这时候 ...
- Oracle中Null与空字符串' '的区别
含义解释: 问:什么是NULL? 答:在我们不知道具体有什么数据的时候,也即未知,可以用NULL,我们称它为空,ORACLE中,含有空值的表列长度为零. ORACLE允许任何一种数据类型的字段为空,除 ...
- oracle 关于null值排序
在oracle中根据字段来desc排序的话null值可能会在数据的最前面.然而有时候我们查看数据的时候并不希望能够在前面看到这些null值的排序数据. 因此我查了一下: 1.排序的时候运用nvl(). ...
- Null 值对索引排序的影响案例一则
--原SQL 语句如下:select * from (select tmp_tb.*, ROWNUM row_id from (select wpid, customer_id, customer_n ...
- SQL——处理列中NULL值
处理NULL值 - 数据库中某列为NULL值,使用函数在列值为NULL时返回固定值. SQLServer:ISNULL(col,value) 示例:SELECT ISNULL(co ...
- hive 配置文件以及join中null值的处理
一.Hive的參数设置 1. 三种设定方式:配置文件 · 用户自己定义配置文件:$HIVE_CONF_DIR/hive-site.xml · 默认配置文件:$HIVE_CONF_DIR/hi ...
- Javascript中null值,特别注意的两点
null 是一个javascript字面量,表示空值,就是没有对象被呈现.他是javascript原始值之一.null值常被放在期望一个对象上,但是不引用任何对象的参数位置,也就是说对象的初始化. 我 ...
随机推荐
- learning nodejs 2 - connect middleware
学习了connect module nodejs 的中间件方式 var connect = require('connect'); var server = connect.createServer( ...
- 标签切换JS代码
//标签切换 var nav = $('.index-nav'); var content = $('.index-nav-content li'); function hoverNav ($eleA ...
- Linux 修改swap虚拟内存大小
swap是内存的交换区:换句话说,如果内存不够用了,那么系统会在硬盘上存储一些内存中不常用的数据,之后将这部分数据在存储中析构掉:这样内存就又有剩余空间可以运行东东啦,这个过程也就是所谓的 ...
- Scala中的空
Scala的有即Any,Scala的无是Null,null,Nil,Nothing,None,Unit.那么这几种空有什么区别呢? 一.Null&null 很多人一辈子都没有走出这个无.Nul ...
- 让CentOS能用yum自动安装rar和unrar
目的:让CentOS能用yum自动安装rar和unrar 系统环境: CentOS 7.0 具体操作步骤如下: 1.编辑文件 编辑dag.repo文件,或者说是新建一个dag.repo文件. vi / ...
- Lombok(1.14.8) - @SneakyThrows
@SneakyThrows @SneakyThrows,声明异常. package com.huey.lombok; import java.io.UnsupportedEncodingExcepti ...
- Linux 命令 - history: 显示或操作历史列表
命令格式 history [-c] [-d offset] [n] history -anrw [filename] history -ps arg [arg...] 命令参数 -c 清除历史列表. ...
- MongoDB - Installing MongoDB on Linux
1. 下载最新稳定版本的安装包. [huey@huey mongodb]$ wget -c --no-check-certificate https://fossies.org/linux/misc/ ...
- Git CMD - push: Update remote refs along with associated objects
命令格式 git push [--all | --mirror | --tags] [--follow-tags] [--atomic] [-n | --dry-run] [--receive-pac ...
- 有些方法为什么会声明称static静态的
有些方法在调用的时候,没有必要都要先实例化一下,只需要:[类名. 静态方法 ]就行了. 哪些方法的调用没有必要实例化呢?网上找了个例子: 举个例子:Car类,1.静态方法Run(),Car.Run() ...