近年来,国内众多厂商都有一体机的产品,不过更多都是围绕硬件本身的堆砌和优化,那么这些产品和Oracle一体机最大的区别在哪里呢?最近读了李亚的《Oracle Exadata技术详解》,系统的了解了Exadata的一些核心特性,我个人认为这些特性就是Oracle一体机最大的优势。为什么这么说呢?举例来说这就好比我们熟悉的iPhone手机,众所周知都知道它的硬件配置并不如同年其他品牌的旗舰机高,但是给使用者的体验确是最稳定的,这很大程度就是因为iPhone软硬件一体,可以进行针对性的定制优化。下面简单介绍下这些属于Exadata的核心特性。

1.Offloading

Offloading可以理解为将一些处理工作“下沉”到Exadata的Cell存储节点来完成。早期被称为Smart I/O。
参数 cell_offload_processing 用来控制是否启用Offloading,默认值为true,也就是默认是启用Offloading功能的。
那么Offloading的功能具体包含哪些呢?
- Smart File Creation
- Smart File Restore
- Smart Scan
- Smart Incremental Backup

基本上从名字上就猜到这些功能的大概作用:

Smart File Creation:智能文件创建。注意真实的Offload并不是发生在创建文件的时候,而是发生在格式化新的数据块过程中。

Smart File Restore:智能文件恢复。可以认为是Smart File Creation的一种特殊形式,发生在数据文件恢复的过程中。

Smart Scan:智能扫描。作为Offloading中最出名的功能,后面会进一步介绍。

Smart Incremental Backup:智能增量备份。10g后引入的bct,在传统Oracle环境中,是以一组数据块变化为单位的;在Exadata环境中,粒度更细,是以一个数据块为单位的,这使得增量备份的数据量大量减少,从而降低了I/O消耗。

值得一提的是,Exadata的db节点和cell节点之间的负载可以互相感知,如果发现cell节点的CPU负载过高,db节点比较空闲时,很可能会发生一部分原本使用smart scan的查询不使用smart I/O过滤,称之为reverse offloading(逆向offloading)。等cell节点压力缓解后又可能会再次执行offloading。

Reverse offload feature enables a storage cell to push some offloaded work back to the database node when the storage cell’s CPU is saturated.

2.SmartScan

上面已经说到,我们耳熟能详的SmartScan其实就是Offloading大类中的一个功能特性。
那么SmartScan具体又包含哪些内容呢?
- Predicate Filter
- Column Filter
- Bloom Filter
- Storage Index
- Function Offload
- Compress/Decompress
- Encrypt/Decrypt
- Virtual Columns Offload

在李亚的书中提到一个非常简单且直观的例子,就是说这样一条SQL:

select customer_id from orders where order_amount > 20000;

如果是传统的数据库架构,数据库内核会发起读取这张表所有块的I/O动作,然后读到buffer cache,再进行SQL处理,最后才把所有满足条件的行与列找出来返回给客户端。

如果是Exadata,会为这个查询构造出一条Exadata特有的iDB指令,发给所有Exadata Cell存储节点上,存储软件会处理筛选数据,将符合要求的行与列返回汇总给数据库该进程的PGA,最终返回给客户端。

对比两种方式,不难发现Exadata的SmartScan大大减轻了数据库服务器的负担,将很大一部分的工作“下沉”到Exadata的Cell存储节点来完成。

这个例子用到的功能就是SmartScan中的Predicate Filter和Column Filter。

我们多思考下,如果是传统数据库架构,这类SQL我们一般都是通过创建合适的索引来减少数据库和存储之间的I/O操作。而Exadata的SmartScan特性,使得很多场景下我们甚至都不需要设计过多的索引也能有很好的性能体验,这也很大程度上减少了DBA的维护工作。

曾遇到过硬件堆砌的普通一体机,因为没有Exadata这样的特性,也没有设计合适的索引,当遭遇一张2.4TB的大表全表扫,扫描期间直接将56GB的IB卡跑满,I/O峰值达到12GB/s(假设单卡去掉损耗估算6GB/s,双卡正好是12GB/s),而该SQL最终返回给客户端的结果集并不多。

还曾听同事讲过,某Exadata的客户,在处理一些SQL优化的时候,经常会尝试使用删除表上索引的操作来让其使用SmartScan特性反而获得较好的优化效果(当然做这种事情一定要事先分析测试验证可行性)。

SmartScan的功能是Exadata特有的,ASM磁盘组有一个cell.smart_scan_capable的属性,可以通过lsattr查看,如果是Exadata存储,默认就是TRUE,且可以修改为FALSE;如果不是Exadata存储,这个属性默认就是FALSE,且无法修改为TRUE。

--方法1: 在SQL>下修改ASM磁盘组的属性
SQL> alter diskgroup DATA set attribute 'cell.smart_scan_capable' = 'FALSE';
Diskgroup altered. --方法2: 在ASMCMD>下修改ASM磁盘组的属性
ASMCMD> setattr -G DATA cell.smart_scan_capable FALSE

如果是非Exadata的存储,无法将此属性修改为TRUE,会报错不兼容,类似如下:

ASMCMD> lsattr -G DATA -l
Name Value
access_control.enabled FALSE
access_control.umask 066
au_size 1048576
cell.smart_scan_capable FALSE
compatible.asm 11.2.0.0.0
compatible.rdbms 11.2
disk_repair_time 3.6h
sector_size 512
ASMCMD> setattr -G DATA cell.smart_scan_capable TRUE
ORA-15032: not all alterations performed
ORA-15242: could not set attribute cell.smart_scan_capable
ORA-15287: could not set disk group attribute cell.smart_scan_capable due to incompatible disks
ORA-15285: disk '/dev/asm-diske' violates disk group attribute cell.smart_scan_capable (DBD ERROR: OCIStmtExecute)
ASMCMD>

3.Storage Index

Storage Index可以说是SmartScan的一部分,它是位于CELL存储节点上一块基于内存的数据结构,旨在过滤无效数据(主要针对有序字段的查询和查询条件包含Null或Not Null的SQL)、减少SmartScan产生的大量Cell物理I/O。
Storage Index是通过Exadata存储软件自动创建,自动维护的,如果存储节点发生重启,Storage Index也会自动被重置。
Storage Index包含存储区域特定字段(对于某一特定的表,每个Storage Index中最多包含8列数据分布信息)的最大值和最小值以及特殊标志位(用来标明字段是否包含Null值)。
首次查询不会用到Storage Index,因为查询条件的字段是第一次使用,在Storage Index中就不包含对应的索引条目,所以在POC等特殊场景下为了演示更好的性能需要预热。
参数_kcfis_storageidx_disabled用来控制是否禁用Storage Index,默认是FALSE,即默认是启用Storage Index特性的。

NAME                                DESCRIPTION                                                        VALUE
----------------------------------- ------------------------------------------------------------------ ------------------------------
_kcfis_storageidx_disabled Don't use storage index optimization on the storage cell FALSE
_kcfis_storageidx_diag_mode Debug mode for storage index on the cell 0

李亚的书中提到,设置参数只是让db层不使用Storage Index,如果需要彻底禁用Storage Index,可在CellCLI下进行设置:

--禁用Storage Index:
CellCLI> alter cell events = "immediate cellsrv.cellsrv_storidx('disable', 'ALL', 0, 0, 0)"; --启用Storage Index:
CellCLI> alter cell events = "immediate cellsrv.cellsrv_storidx('enable', 'ALL', 0, 0, 0)"; --清除Storage Index:
CellCLI> alter cell events = "immediate cellsrv.cellsrv_storidx('purge', 'ALL', 0, 0, 0)";

如果需要跟踪Storage Index的内部行为,可以通过将参数_kcfis_storageidx_diag_mode设置为2,这会在Cell存储节点上生成trace带来额外开销,需慎重评估使用。

还有一种方法是李亚在书中推荐使用的,直接在存储端CellCLI命令行下执行:

CellCLI> alter cell events = "immediate cellsrv.cellsrv_setparam('_cell_thread_max_trace_file_size', '17024')";
CellCLI> alter cell events = "immediate cellsrv.cellsrv_storidx(dumpridx, all, 0, 0, 0)";

通过前面对Offloading、SmartScan、Storage Index的概念学习,大概从范围来看可以简单理解为:Offloading > SmartScan > Storage Index。

但某些场景大家聊到这些概念可能不会区分的这么清楚,比如有时候人家说Offloading可能就是特指SmartScan,诸如此类根据语境判断即可,也不要过于较真,自己心里要有个认识能明白对方的意思即可。

Oracle Exadata 学习笔记之核心特性Part1的更多相关文章

  1. Oracle RAC学习笔记:基本概念及入门

    Oracle RAC学习笔记:基本概念及入门 2010年04月19日 10:39 来源:书童的博客 作者:书童 编辑:晓熊 [技术开发 技术文章]    oracle 10g real applica ...

  2. Oracle RAC学习笔记01-集群理论

    Oracle RAC学习笔记01-集群理论 1.集群相关理论概述 2.Oracle Clusterware 3.Oracle RAC 原理 写在前面: 最近一直在看张晓明的大话Oracle RAC,真 ...

  3. Oracle RAC学习笔记02-RAC维护工具集

    Oracle RAC学习笔记02-RAC维护工具集 RAC维护工具集 1.节点层 2.网络层 3.集群层 4.应用层 本文实验环境: 10.2.0.5 Clusterware + RAC 11.2.0 ...

  4. Oracle基础学习笔记

    Oracle基础学习笔记 最近找到一份实习工作,有点头疼的是,有阶段性考核,这...,实际想想看,大学期间只学过数据库原理,并没有针对某一数据库管理系统而系统的学习,这正好是一个机会,于是乎用了三天时 ...

  5. [Oracle]OWI学习笔记--001

    [Oracle]OWI学习笔记--001 在 OWI 的概念里面,最为重要的是 等待事件 和 等待时间. 等待事件发生时,需要通过 P1,P2,P3 查看具体的资源. 可以通过 v$session_w ...

  6. Oracle Exadata体系笔记

    Exadata一开始是以一个存储系统形式诞生的,叫做SAGE(Storage Appliance for Grid Environ ments,网格环境存储设备)   Exadata原本设计用来解决超 ...

  7. 前端学习笔记 --ES6新特性

    前言 这篇博客是我在b站进行学习es6课程时的笔记总结与补充. 此处贴出up主的教程视频地址:深入解读ES6系列(全18讲) 1.ES6学习之路 1.1 ES6新特性 1. 变量 2. 函数 3. 数 ...

  8. AMQ学习笔记 - 12. Spring-JmsTemplate特性设置

    概述 这是关于JmsTemplate的最后一篇总结,且只会介绍几个比较重要的特性. 消息的递送模式 在发送消息给时,可以告知这是持久化的消息,还是非持久化的消息.如果是非持久化的消息,broker会将 ...

  9. Struts2 学习笔记 10 Result部分 part1

    1.关于Result我们首先来学习一下结果类型 result type. 先来看struts.xml. struts.xml <?xml version="1.0" enco ...

随机推荐

  1. C语言调试器GDB和LLDB的使用方法

    调试器的使用 编译输出带调试信息的程序 调试信息包含:指令地址.对应源代码及行号 指令完成后,回调 LINUX使用GDB MAX使用LLDB 使用说明 // 开始调试testlib程序 lldb te ...

  2. ubuntu14 安装git

    1.安装git Step1 测试git是否安装,终端输入 $ git 没有安装时,不会识别git命令:

  3. 2016 年 31 款轻量高效的开源 JavaScript 插件和库

    目前有很多网站设计师和开发者喜欢使用由JavaScript开发的插件和库,但同时面临一个苦恼的问题:它们中的大多数实在是太累赘而且常常降低网站的性能.其实,其中也有不少轻量级的插件和库,它们不仅轻巧有 ...

  4. 警示框UIAlertController的使用(看完马上会用!!)

    本文尽量图文并茂,并且提供对应的代码,确保看到这篇文章马上能够上手使用UIAlertController控件.-我要兑现我的务实宣言- 本文构思: 1.出具效果图,通过这种最直接方式了解该控件的展示效 ...

  5. nginx 安装部署前篇

    官网:https://nginx.org/ 特性:既可以作为HTTP服务器,也可以作为反向代理服务器或者邮件服务器或者邮件服务器:能够快递响应静态页面的请求:支持 Fast CGI.SSL.Virtu ...

  6. Java的clone方法效率问题

    在Java中,经常会需要新建一个对象,很多情况下,需要这个新建的对象和现有的某个对象保持属性一致. 那么,就有两种方式来实现这个对象的构造: ①通过新建一个对象,为这个对象的属性根据原有对象的属性来进 ...

  7. myeclipse汉化

    MyEclipse默认安装在计算机用户目录下面,安装完成后对MyEclipse快捷方式使用鼠标右键属性---打开文件位置--进入安装的目录下面即可看到 zh_CN.7z解压缩将zh_CN目录文件放到 ...

  8. Day2-N-滑雪-POJ1088

    Michael喜欢滑雪百这并不奇怪, 因为滑雪的确很刺激.可是为了获得速度,滑的区域必须向下倾斜,而且当你滑到坡底,你不得不再次走上坡或者等待升降机来载你.Michael想知道载一个区域中最长底滑坡. ...

  9. SciPy 信号处理

    章节 SciPy 介绍 SciPy 安装 SciPy 基础功能 SciPy 特殊函数 SciPy k均值聚类 SciPy 常量 SciPy fftpack(傅里叶变换) SciPy 积分 SciPy ...

  10. 织梦 dede runphp=yes SQL语句操作

    个人实例dede:channelartlist 下循环出 channel 栏目 中的 文章 {dede:sql sql='select * from dede_arctype where reid = ...