目录:

  1. 简介

  2. 压缩方式及压缩比

  3. 压缩哪些数据

  4. 可能有用的脚本

 

一、简介

  EHCC(Exadata Hybrid Columnar Compression),是Oralce 数据库在12C 中新增加的压缩方式,除了具有压缩数据的功能外,还有一个特点就是列式存储。

  也就是说,当通过EHCC方式对数据库所有数据进行压缩后,从数据存储方式上来看,可以理解成一个列式存储数据库。那么列式存储在经分系统中的高效在很多专门的列式数据库中已经体现得非常明显。这里不再拿数据说事。

  这也是Oracle 占领市场的又一尖刀。Oracle 说了,你有的,我有。你没有的,我也有,哪怕我现在没有,也很快会有!

  同时,我们可以将EHCC理解为磁盘版的 in-memory 。

  与传统的压缩方式对比,之前的压缩方式更适用于OLTP系统。而EHCC则更适合于DSS 系统,及部分OLAP系统业务。

二、压缩方式及压缩比

  表1:压缩方式及压缩比

压缩方式 压缩比
BASE   65%
FOR OLTP 62%
Qery High 95%
Qery Low 89%
Archive High 97.5%
Archive Low 95%

  2.1. 压缩比

     先说明下压缩比的概念: (1-压缩后的空间/未压缩前的空间)*100% 。 即为压缩掉的空间占原空间的比例。

     比如一张未经压缩的表的数据量为20G .那么 base 方式压缩,压缩比为65%,也就是说会压缩掉20G*65%=13G. 压缩掉13G,压缩完后,该表占用空间为7G.

     1.  BASE  与 OLTP   压缩效率差不多,而它们之间的那点差别,可能是因为BASE方式表的PCT_FREE 为0,而OLTP 为10%。
     2. QUERY LOW       相对压缩率不高,采用LZO压缩算法,但是也比ORACLE自带的压缩效果高很多
     3. QUERY HIGH和ARCHIVE LOW     都是使用ZLIB压缩算法。因此压缩几乎是相等的。
     4. ARCHIVE HIGH    采用Bzip2压缩算法实现 ,压缩比极高,

     EHCC特性支持普通的数据表和分区

    •  支持分区

      除普通堆表外,还支持对单个分区进行压缩。

        如:  

  1. create table test_ehcc_compression (id)
  2. partition by range (id)
  3. partition p1 values less than (100) nocompress,
  4. partition p2 values less than (200) compress for archive low,
  5. partition p3 values less than (300) compress for query high,
  6. partition p4 values less than (400) compress for query low);

三、压缩哪些数据

  需要注意的一点是,对于启用了EHCC的表,并不是将插入表的所有数据都会进行EHCC的方式进行压缩。而是只有通过特定的方式插入表的数据才会处理。

  • 对于单行的insert 语句:新添加的行贿通过OLTP方式被压缩。
  • 对于update语句:修改会被转换为delete 和insert。
  • 对于delete 语句:删除只会在CU头当中对应的位上将该行标识成无效
  • alter 语句启用EHCC时,原有数据不压缩,只处理新数据。

  对于使用了EHCC的表,只有在使用以下的方式向表当中加载数据时才会触发数据压缩。

  • 直接路径insert语句
  • 并行的DML语句
  • 直接路径sqlloader
  • CTAS(create table as select)

四、可能有用的脚本

1. 进行数据压缩比对比的SQL脚本

  

  1. -- 准备初始数据
  2. create table Test_objects as select * from dba_objects;
  3.  
  4. begin
  5. for i in 1..100000 loop
  6. insert into Test_objects select * from dba_objects;
  7. commit;
  8. end loop;
  9. end;
  10. /
  11.  
  12. -- 查看初始数据量
  13. select segment_name
  14. , segment_type
  15. , round(sum(bytes)/1024/1024/1024,2) size_gb
  16. from dba_segments
  17. where segment_name ='TEST_OBJECTS'
  18. group by segment_name,segment_type
  19. order by 1;
  20.  
  21. -- 生成不同压缩方式的表
  22. create table test_objects_base compress nologging select/*+ parallel(a,10) */ from Test_objects a;
  23. create table test_objects_oltp compress for oltp nologging select/*+ parallel(a,10) */ from Test_objects a;
  24. create table test_objects_olap compress for olap nologging select/*+ parallel(a,10) */ from Test_objects a;
  25. create table test_objects_base compress for query high parallel 10 nologging select/*+ parallel(a,10) */ from Test_objects a;
  26. create table test_objects_base compress for query low parallel 10 nologging select/*+ parallel(a,10) */ from Test_objects a;
  27. create table test_objects_base compress for archive high parallel 10 nologging select/*+ parallel(a,10) */ from Test_objects a;
  28. create table test_objects_base compress for archive low parallel 10 nologging select/*+ parallel(a,10) */ from Test_objects a;
  29.  
  30. -- 取得压缩前后各表的占用空间及各自的压缩方式
  31. select s.owner,segment_name,s.bytes/(1024*1024*1024) t_size,compress_for
  32. from dba_segments s,dba_tables t
  33. where s.owner=t.owner and t.table_name=s.segment_name
  34. and s.owner='&owner' and t.table_name like 'TEST_OBJECTS%';

  2. 压缩表之前预估压缩比的脚本

  1. declare
  2. v_blkcnt_cmp pls_integer;
  3. v_blkcnt_uncmp pls_integer;
  4. v_row_cmp pls_integer;
  5. v_row_uncmp pls_integer;
  6. v_cmp_ratio number;
  7. v_comptype_str varchar2(60);
  8. begin
  9. dbms_compression.get_compression_ratio(
  10. scratchtbsname => upper('&ScratchTBS'),
  11. ownname => user,
  12. tabname => upper('&TableName'),
  13. partname => NULL,
  14. comptype => dbms_compression.comp_for_query_high,
  15. blkcnt_cmp => v_blkcnt_cmp,
  16. blkcnt_uncmp => v_blkcnt_uncmp,
  17. row_cmp => v_row_cmp,
  18. row_uncmp => v_row_uncmp,
  19. cmp_ratio => v_cmp_ratio,
  20. comptype_str => v_comptype_str);
  21. dbms_output.put_line('Estimated Compression Ratio: '||to_char(v_cmp_ratio));
  22. dbms_output.put_line('Blocks used by compressed sample: '||to_char(v_blkcnt_cmp));
  23. dbms_output.put_line('Blocks used by uncompressed sample: '||to_char(v_blkcnt_uncmp));
  24. end;
    /

ORACLE EHCC(exadata hybrid columnar compression)的更多相关文章

  1. Oracle Schema Objects——Tables——Table Compression

    Oracle Schema Objects Table Compression 表压缩 The database can use table compression to reduce the amo ...

  2. 【Oracle】Exadata虚拟机配置(一)

    Exadata是Oracle软硬结合的一体机.通过自己的机子不可能全然模拟出来,这里搭建的虚拟机仅仅是一个简单的.能够供我们学习Exadata的环境. 最简单能够模拟的Exadata虚拟机须要两个节点 ...

  3. ORACLE 11G R2 RAC classical install OGG12.1(LINUX) 经典抽取模式单项同步配置OGG12.1

    博文结构图如下: 一.环境描述以及注意事项 1.1 环境简介 IP 系统 Oracle版本 OGG版本 源端 172.16.10.16/36 RHEL6.5 oracle11204 12.1 目标端 ...

  4. [20180814]慎用查看表压缩率脚本.txt

    [20180814]慎用查看表压缩率脚本.txt --//最近看exadata方面书籍,书中提供1个脚本,查看某些表采用那些压缩模式压缩比能达到多少.--//通过调用DBMS_COMPRESSION. ...

  5. 在物理 Data Guard 中对异构主备系统的支持 (文档 ID 1602437.1)

    Data Guard中主数据库与物理备用数据库(Redo Apply)之间可以有什么差别?本说明针对重做应用和 Oracle Data Guard 12 发行版 1 进行了更新.它适用于 Oracle ...

  6. Oracle Exadata体系笔记

    Exadata一开始是以一个存储系统形式诞生的,叫做SAGE(Storage Appliance for Grid Environ ments,网格环境存储设备)   Exadata原本设计用来解决超 ...

  7. oracle 12cR1&12cR2核心高实用性新特性

    今天把本地环境升到了12.2.12c应该来说无论从性能和功能性方面都得到了很大的加强,就是不知道实际license怎么卖...原来有些功能在exadata中可用的,现在在12c中可用了,估计很大程度上 ...

  8. Exadata 12.2.1.1.0 Highlights

    突然发现,在中国农历新年的这几年里,Exadata 12.2版本已经发布了. 本起去docs.oracle.com上看看它的新特性,结果发现文档还没有更新: 下面是找到的一些资料,让我们来一睹为快吧: ...

  9. oracle 表压缩技术

    压缩表是我们维护管理中常常会用到的.以下我们看都oracle给我们提供了哪些压缩方式. 文章摘自"Oracle® Database Administrator's Guide11g Rele ...

随机推荐

  1. vue WepApp 音乐App实战以及各个知识点

    1.组件初始化(scoped 貌似属于局域css样式) 2.组件使用三部曲(当然第三步可以<MHeader></MHeader> 也不报错) 3. 配置 路由 ①.在route ...

  2. CSS 模块的侦测

    CSS 的规格发展太快,新的模块层出不穷.不同浏览器的不同版本,对 CSS 模块的支持情况都不一样.有时候,需要知道当前浏览器是否支持某个模块,这就叫做“CSS模块的侦测”. 一个比较普遍适用的方法是 ...

  3. python基础-----字符编码

    1.ASCII ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现 ...

  4. OGG初始化之使用数据库实用程序加载数据

    Loading Data with a Database Utility 要使用数据库复制实用程序建立目标数据,您需要启动更改同步提取组,以便在数据库实用程序创建并应用数据的静态副本时提取正在进行的数 ...

  5. git与eclipse集成之导入组件到Eclipse工程

    从工作目录中选择要导入的组件,右键选择:Import Projects,弹出窗口如下图所示,选择Import as general project 点击next,修改或使用默认的组件名称 点击fini ...

  6. UDP/TCP拾遗

    1.UDP的特点 (1)UDP 是无连接的,即发送数据之前不需要建立连接. (2)UDP 使用尽最大努力交付,即不保证可靠交付,同时也不使用拥塞控制. (3)UDP 是面向报文的.UDP 没有拥塞控制 ...

  7. 最新版Kali Linux虚拟机安装Open-vm-tools替代VMware tools

    自从Kali 2.0发布之后,会经常遇到安装vmware tools无法成功,或者提示安装成功了但是仍旧无法进行文件拖拽.复制和剪切的问题. 今天给新电脑装系统,重新下载了最新版,Kali 2017. ...

  8. HNU 2015暑期新队员训练赛2 H Blanket

    把每个 bi *x + ri ( 0 <= ri <= ai)标记, 输出被标记 0 – N 次的个数 #include<iostream> #include<cstdi ...

  9. 本地项目提交到github和提交更新(转)

    一:首先当然是去github注册账号了. 二:注册完毕登录后,在自己的首页上面点击右上角“+”号,然后选择New repository,或者直接点击下面的绿色按钮,创建一个新仓库.如图: 然后填入仓库 ...

  10. AMQP消息队列之RabbitMQ简单示例

    前面一篇文章讲了如何快速搭建一个ActiveMQ的示例程序,ActiveMQ是JMS的实现,那这篇文章就再看下另外一种消息队列AMQP的代表实现RabbitMQ的简单示例吧.在具体讲解之前,先通过一个 ...