oracle 索引聚簇表的工作原理

一：首先介绍一下索引聚簇表的工作原理：（先创建簇，再在簇里创建索引，创建表时指定列的簇类型）

聚簇是指：如果一组表有一些共同的列，则将这样一组表存储在相同的数据库块中；聚簇还表示把相关的数据存储在同一个块上。利用聚簇，一个块可能包含多个表的数据。概念上就是如果两个或多个表经常做链接操作，那么可以把需要的数据预先存储在一起。聚簇还可以用于单个表，可以按某个列将数据分组存储。

更加简单的说，比如说，EMP表和DEPT表，这两个表存储在不同的segment中，甚至有可能存储在不同的TABLESPACE中，因此，他们的数据一定不会在同一个BLOCK里。而我们有会经常对这两个表做关联查询，比如说：select * from emp,dept whereemp.deptno = dept.deptno.仔细想想，查询主要是对BLOCK的操作，查询的BLOCK越多，系统IO就消耗越大。如果我把这两个表的数据聚集在少量的BLOCK里，查询效率一定会提高不少。

比如我现在将值deptno=10的所有员工抽取出来，并且把对应的部门信息也存储在这个BLOCK里（如果存不下了，可以为原来的块串联另外的块）。这就是索引聚簇表的工作原理。

二：创建过程。

索引聚簇表是基于一个索引聚簇（index cluster）创建的。里面记录的是各个聚簇键。聚簇键和我们用得做多的索引键不一样，索引键指向的是一行数据，聚簇键指向的是一个ORACLE BLOCK。我们可以先通过以下命令创建一个索引簇。

 SQL> conn scott/tiger

    已连接。

   SQL> desc dept

   名称                                     是否为空? 类型

  ----------------------------------------- ------------------------------------

    DEPTNONOT NULL NUMBER(2)

    DNAMEVARCHAR2(14)

    LOCVARCHAR2(13)

   SQL> create cluster emp_dept_cluster

    2 (deptno number(2) )

    3 size1024

    4 /

    簇已创建。

这个名字可以用户定义，不一定叫deptno，数据类型必须和需要使用这个聚簇的数据类型一致NUMBER(2)。在这里最关键的一个参数是size。这个选项原来告诉Oracle：我们希望与每个聚簇键值关联大约1024字节的数据（1024对于一般的表一条数据没问题），oracle会在用这个数据库块上设置来计算每个块最多能放下多少个聚簇键。假设块大小为8KB，Oracle会在每个数据库块上放上最多7个聚簇键，也就是说，对应部门10、20、30、40、50、60和70的数据会放在一个块上，一旦插入部门80，就会使用一个新块。存放的数据是和插入顺序相关的。

因此，SIZE测试控制着每块上聚簇键的最大个数。这是对聚簇空间利用率影响最大的因素。如果把这个SIZE设置得太高，那么每个块上的键就会很少（单位BLOCK可以存的聚簇键就少了），我们会不必要地使用更多的空间。如果设置得太低，又会导致数据过分串链（一个聚簇键不够存放一条数据），这又与聚簇本来的目的不符，因为聚簇原本是为了把所有相关数据都存储在一个块上。

向聚簇中放数据之前，需要先对聚簇建立索引。可以现在就在聚簇中创建表，但是由于我们想同时创建和填充表，而有数据之前必须有一个聚簇索引，所以我们先来建立聚簇索引。

聚簇索引的任务是拿到一个聚簇键值，然后返回包含这个键的块的块地址。实际上这是一个主键，其中每个聚簇键值指向聚簇本身中的一个块。因此，我们请求部门10的数据时，Oracle会读取聚簇键，确定相应的块地址，然后读取数据。聚簇键索引如下创建：

   SQL> create index emp_dept_cluster_idx

    2 oncluster emp_dept_cluster

    3 /

   索引已创建。

   现在可以创建表了：

   SQL> conn segment_study/liugao

    已连接。

   SQL> create table dept

   2  ( deptno number(2) primary key,3   dname  varchar2(14),

    4 locvarchar2(13)

    5 )

    6 clusteremp_dept_cluster(deptno)

    7 /

    表已创建。

   SQL> create table emp

   2  (empno    numberprimary key,3   ename   varchar2(10),4   job     varchar2(9),5   mgr     number, 6   hiredate date,7   sal     number, 8   comm    number,

    9 deptnonumber(2) constraint emp_fk references dept(deptno)

    10 )

    11cluster emp_dept_cluster(deptno)

    12 /

    表已创建。

我们可以通过一下SQL语句查看创建：

 SQL> select cluster_name, table_name

    2 fromuser_tables

    3 wherecluster_name is not null

    4 orderby 1;

   CLUSTER_NAME TABLE_NAME

  -----------------------------------------------------------

   EMP_DEPT_CLUSTER DEPT

   EMP_DEPT_CLUSTER EMP

现在，聚簇，聚簇索引，聚簇索引表都已经建立完成。

三：加载数据。

向聚簇索引表中加载数据是个很讲究的事情，处理方法不对，会使得聚簇的功能发挥不完全，降低查询性能。

方法1：

首先，我增加一个很大的列char（1000）,加这个列是为了让EMP行远远大于现在的大小。使得一个1024的聚簇无法存储一行记录。不能加varchar2(1000),因为ORACLE对varchar2存储的原则是能省就省，如果数据数据不到1000，不会分配1000的空间的。char则是有多少用多少。呵呵。

 SQL> begin

   2     for x in ( select * from scott.dept )

    3loop

    4 insertinto dept

   5         values ( x.deptno, x.dname, x.loc );

    6 insertinto emp

    7 select*

   8           from scott.emp9          where deptno = x.deptno;

    10 endloop;

    11end;

    12 /

    begin

    *

第1行出现错误:

  ORA-02032:聚簇表无法在簇索引建立之前使用

   ORA-06512:在line 4

   SQL> create index emp_dept_cluster_idx

    2 oncluster emp_dept_cluster

    3 ;

   索引已创建。

   SQL> alter table emp disable constraint emp_fk;

    表已更改。

   SQL> truncate cluster emp_dept_cluster;

    簇已截断。

   SQL> alter table emp enable constraint emp_fk;

    表已更改。

   SQL> alter table emp add data char(1000);

    表已更改。

   上面的执行错误说明聚簇表无法在簇索引建立之前使用。

   首先我们通过先加载emp表，后加载dept表的方式。

   SQL> insert into dept

   2  select * from scott.dept;已创建4行。

   SQL> insert into emp

   2  select emp.*, '*' from scott.emp;已创建14行。

   然后做一个查询，通过dbms_rowid.rowid_block_number可以查看此数据所在的BLOCKID,如果dept和emp存储的行数据不是一个BLOCK ID ,则标记一个'*'.查询结果如下：

   SQL> select dept_blk, emp_blk,2        case when dept_blk <> emp_blk then'*' end flag,

    3deptno

    4 from(

   5  selectdbms_rowid.rowid_block_number(dept.rowid) dept_blk,6        dbms_rowid.rowid_block_number(emp.rowid) emp_blk,7        dept.deptno 8   from emp, dept 9   whereemp.deptno = dept.deptno

    10 )

    11 orderby deptno

    12 /

    DEPT_BLKEMP_BLK F DEPTNO

  ---------- ---------- - ----------

    85 86 *10

    85 86 *10

    85 87 *10

    85 8520

    85 87 *20

    85 86 *20

    85 8520

    85 86 *20

    85 8530

    85 86 *30

    85 8530

    DEPT_BLKEMP_BLK F DEPTNO

  ---------- ---------- - ----------

    85 86 *30

    85 8530

    85 8530

   已选择14行。

   我们发现，通过先插入emp数据，再插入dept数据，导致大部分的emp和dept的数据都不在一个block上，这不是我们使用聚簇索引的目的。

oracle 索引聚簇表的工作原理的更多相关文章

Oracle创建聚簇表
创建聚簇表过程: 创建簇(cluster)----创建簇表(基本类似创建一般表但有区别)----创建簇索引(index)----数据管理创建簇: create cluster stu_ach(sid ...
oracle聚簇表的理解（转自：https://blog.csdn.net/gumengkai/article/details/51009345 ）
Oracle支持两种类型的聚簇:索引聚簇和哈希聚簇一.索引聚簇表的原理聚簇:如果一些表有一些共同的列,则将这样一组表存储在相同的数据块中聚簇还表示把相关的数据存储在同一个块上.利用聚簇,一个块可 ...
Oracle索引梳理系列（五）- Oracle索引种类之表簇索引（cluster index）
版权声明:本文发布于http://www.cnblogs.com/yumiko/,版权由Yumiko_sunny所有,欢迎转载.转载时,请在文章明显位置注明原文链接.若在未经作者同意的情况下,将本文内 ...
oracle的散列聚簇表
在簇表中,Oracle使用存储在索引中的键值来定位表中的行, 而在散列聚簇表中,使用了散列函数代替了簇索引,先通过内部函数或者自定义的函数进行散列计算,然后再将计算得到的码值用于定位表中的行. 创建散 ...
聚簇（Cluster）和聚簇表（Cluster Table）
聚簇(Cluster)和聚簇表(Cluster Table) 时间:2010-03-13 23:12来源:OralanDBA.CN 作者:AlanSawyer 点击:157次 1.创建聚簇 icmad ...
Oracle 索引创建、表分区
--EAF_WORKFLOWSTEP 表创建 CREATE TABLE EAF_WORKFLOWSTEP ( ) NOT NULL PRIMARY KEY USING INDEX TABLESPACE ...
Oracle索引梳理系列（九）- 浅谈聚簇因子对索引使用的影响及优化方法
版权声明:本文发布于http://www.cnblogs.com/yumiko/,版权由Yumiko_sunny所有,欢迎转载.转载时,请在文章明显位置注明原文链接.若在未经作者同意的情况下,将本文内 ...
Oracle表介绍--簇表
簇和簇表簇其实就是一组表,是一组共享相同数据块的多个表组成. 将经常一起使用的表组合在一起成簇可以提高处理效率. 在一个簇中的表就叫做簇表.建立顺序是:簇→簇表→数据→簇索引 ...
Oracle索引表
索引组织表(Index-Organized Table)是按B-树的结构来组织和存储数据的.与标准表中的数据时无序存放的不同,索引表中数据按主键值有序存储. 叶子节点中存放的是表的主键值与所有非主键值 ...

随机推荐

java 第九次作业
一.题目:利用接口和接口回调,实现简单工厂模式,当输入不同的字符,代表相应图形时,利用工厂类获得图形对象,再计算以该图形为底的柱体体积. 二.代码 /* 5个形状类分别调用Shape接口: 柱体类中, ...
xml文件整理
xml 97-2003 格式 \s*\n\s*\n\s*\n\s*\n\n(^个人补充信息.*)\n(.*)\n(^总成绩.*)$1$2\n$3(^个人补充信息.*)\n(.*)\n(.*)\n(^总 ...
SP1825 【FTOUR2 - Free tour II】
# $SP1825$ 看到没有人用老师的办法,于是自己写一下思路思路第一步:排除旧方法首先这道题和$4178$不一样,因为那道题是计数,而这道题是求最值,最值有个坏处,就是对于来自相同子树 ...
Kafka kSQL sql查询
背景 kafka早期作为一个日志消息系统,很受运维欢迎的,配合ELK玩起来很happy,在kafka慢慢的转向流式平台的过程中,开发也慢慢介入了,一些业务系统也开始和kafka对接起来了,也还是很受大 ...
cube.js 学习（六）cube.js segments 说明
segments 是你需要查询的数据的子集,实际上filter 也可以做类似的事情,但是,目前这个设计估计是为了更好的数据查询吧,同时在操作界面上我们也可以看出来参考格式 segments: { ...
bash: cd: too many arguments 报错
路径名或者变量有空格时候,会造成参数太多的错误提示解决方法:把空格的地方用引号包括起来
shell脚本之 operater.sh 算术运算符；比较运算符；布尔运算符；逻辑与或非运算符；字符串运算符的使用
1.注意格式不能变尤其是变量和变量表达式之间的空格:[ 空格] .[ $a == $b ] 中间的空格严格不能变:否则报错关系运算符关系运算符只支持数字,不支持字符串,除非字符串的值是数字. ...
noi.ac #42 模拟
$des$ 二维平面上存在 $m$ 个点,每个点会对该点的 $8$ 个方向上的最近的点产生影响问每个点会被影响多少次 $sol$ 过每个点会产生 $4$ 条线段保存每条线段的斜 ...
LibreOJ #528. 「LibreOJ β Round #4」求和
二次联通门 : LibreOJ #528. 「LibreOJ β Round #4」求和 /* LibreOJ #528. 「LibreOJ β Round #4」求和题目要求的是有多少对数满足他们 ...
luogu P1046 陶陶摘苹果
二次联通门 : luoguP1046 /* 这个题好难..... 由苹果树可知这应该是个树结构的题所以很自然的想到了用树链剖分来搞一下连边最后查询以1为根节点的子树的权值和... 从前闲的没事 ...

oracle 索引聚簇表的工作原理

oracle 索引聚簇表的工作原理的更多相关文章

随机推荐

热门专题