1. 1.     

在历史数据转出测试过程中,通过不断的优化,包括SQL调整和数据库调整,从AWR中看到,基本上难以进行更多的性能提升,于是准备试试并行执行的特性,从这个任务的特点来分析,也比较适合采用这项技术。本文介绍了使用并行执行过程中的常用SQL,以及遇到的一些问题,以及性能对比试验的结果,并且分享了一些问题的解决经验,分析了适合并行执行的场景。

  1. 2.      概念及常用语法

并行执行通过充分利用硬件资源来实现特定任务的性能提升,将一个SQL语句同时分布到多个CPU上去执行,从而缩短总的耗时。

Oracle的并行执行包括:

1)        并行查询

2)        并行DML(insert,delete,update)

3)        并行DDL(表和索引的创建)。

为了方便参考使用,下面将收集的常用语句按并行执行的三个级别进行介绍:

对象级

设置表和索引的并行度,从而使用涉及这些对象的SQL操作按设定的并行度执行。

例如:alter table 门诊费用记录 parallel 8;

alter index 门诊费用记录_IX_登记时间 parallel;

如果不指定并行度的值,Oracle会根据参数和CPU数来估算一个缺省值。

禁用并行度(指定并行度为1或使用noparallel):

alter table 门诊费用记录 parallel 1;

alter index 门诊费用记录_IX_登记时间 noparallel;

如果不改变对象的并行度属性,唯一可以禁用并行查询的方法是将初始化参数parallel_max_servers设置为0。

会话级

人工启用和禁用的语法如下:

ALTER Session ENABLE PARALLEL query[|DML|DDL];

ALTER Session DISABLE PARALLEL query[|DML|DDL];

强制按指定的并行度执行。

ALTER Session FORCE PARALLEL QUERY PARALLEL 8;

ALTER Session FORCE PARALLEL DML PARALLEL 8;

ALTER Session FORCE PARALLEL DDL PARALLEL 8;

强制并行对于递归SQL不起作用,但覆盖表或索引上定义的并行度。

查询当前会话是否启用了并行执行:

(Oracle 10.2.0.1上,缺省启用了并行QUERY和DDL,没有启用DML)

SQL> SELECT pq_status ,pdml_status, pddl_status

FROM v$session WHERE sid=sys_context('userenv','sid');

PQ_STATUS PDML_STATUS PDDL_STATUS

--------- ----------- -----------

ENABLED   DISABLED    ENABLED

语句级

通过在SQL中添加提示来指定并行执行及并行度。

优化器只是按指定的提示来考虑是否使用并行执行,并不会强制使用(它会选择成本最低的那一个执行计划)

例如:

Select /*+ parallel(t1,8)*/count(*) from 门诊费用记录 t1;

Create table 医嘱执行时间 parallel 8 as

select /*+ parallel(t1,8)*/* from医嘱执行时间 t1;

alter index 门诊费用记录_IX_登记时间 rebuild parallel 8;

注意

并行DML需要先在会话级显示的启用,并且需要同时启用并行查询;

例:

SQL>ALTER Session ENABLE PARALLEL DML;

SQL> ALTER Session ENABLE PARALLEL QUERY;

SQL> Update /*+ parallel(t1,8)*/ 门诊费用记录 t1

Set 待转出 = 132

Where 结帐id In

(Select  /*+ parallel(t2,8)*/结帐id From 病人预交记录 t2 Where 待转出 = 132);

如果不提交事务,该会话的后续SQL无法访问被修改的表,查询未提交事务的表,将会返回错误:”ora-12838:无法读取、修改一个被并行修改过的表”

定义主键约束时,无法并行的自动创建主键索引,但可以采取以下变通方式:

CREATE UNIQUE INDEX 检验标本记录_UQ_标本序号

ON 检验标本记录(核收时间, 仪器ID, 标本序号, 标本类别) PARALLEL 8;

ALTER TABLE 检验标本记录 ADD CONSTRAINT

检验标本记录_UQ_标本序号 Unique (核收时间, 仪器ID, 标本序号, 标本类别);

这种方式创建的主键约束与自动创建的有一个差别,就是删除主键的时候,不会自动删除对应的索引,需要增加删除索引的语法,例:

ALTER TABLE 检验标本记录 drop

CONSTRAINT 检验标本记录_UQ_标本序号 cascade drop index;

另外,关于并行查询的参数配置,大部分情况下,无须调整,网上的资料比较多,这里不再一一列举。仅说明一个参数:

当执行并行重建索引时,可能会遇到ora-00600错误,通过修改参数parallel_execution_message_size可解决这个问题,例:

SQL> alter system set parallel_execution_message_size=8192 scope=spfile;

缺省值为2148,对于一般的并行任务,这个值太小。

修改后需重启数据库。

  1. 3.      使用效果

并行查询及并行DML

由于所使用的历史数据转出,大部分查询均是索引范围扫描,没有全表扫描,所以,不适合并行执行。

但是,由于一次意外操作:索引压缩重建(并行DDL),执行后导致索引的属性自动加上了并行度,导致相关的SQL查询自动启用了并行查询,结果,执行计划采用了大表全表扫描,采用hash连接或嵌套连接,导致查询异常缓慢。

一些复杂的SQL执行超过了一个小时,甚至下面这种简单的SQL执行超过了5个小时仍然没有返回结果:

Update /*+ rule*/ 病人医嘱计价

Set 待转出 = n_批次

Where 医嘱id In (Select ID From 病人医嘱记录 Where 待转出 = n_批次);

查看执行计划,发现采用了全表扫描+嵌套连接索引的方式。

并且,提示字rule失效,优化器模式变成了CBO。最后,取消了索引的并行度,然后,重建索引,禁用了压缩特性,最终执行计划才恢复了正常。

因为普通的索引范围扫描并不能使用并行查询(除非是分区索引),所以,优化器会选择全表扫描方式,但是很多时候这并不是我们所期望的访问方式。

所以,并行查询和并行DML一定要慎重,否则,性能差别非常大。

直接路径插入

       为了快速的加载大量数据,采用直接路径插入方式可以大幅提升插入性能。

直接路径插入自动对insert 和Select操作采用了并行执行,并且目标表采用nologging最小日志模式的话,试验表明,最高可减少5倍的耗时。

例:

Insert Into /*+ append*/H住院费用记录(ID, 记录性质, NO, ……)

Select ID, 记录性质, NO, ……  From 住院费用记录  Where 待转出 = 132;

 

并行DDL

历史数据转出过程中,需要重建转出表上的查询所用到的索引,以便及时回收空间,加快查询速度,但这个索引重建的过程非常耗时。测试环境的配置为:32G内存、32路CPU(4*8)、Raid10的SCSI硬盘。

测试结果表明

  1. 并行DDL要50%以上。

没有并行时,重建索引需要36分钟,并行执行只需要16分钟。

  1. 并不是并行度越高就越快。

因为磁盘IO所限,该环境下并行度为8时最快

并行收集统计信息

收集对象统计信息的时候,有一个参数可以指定并行度,并行的效果非常明显。试验表明,收集ZLHIS的所有对象,并行执行可以将整个时间由1个半小时缩短到30分钟左右。

  1. 4.      小结

并行执行属于Oracle的OLAP应用特性之一,如果你有一些耗时很长的任务,并且服务器有大量的闲置资源(CPU,内存,IO带宽),则比较适合采用并行执行技术,它可以给你带来成倍的性能提升效果,否则,并行执行可能会由于大量的消耗资源从而影响其他人的正常使用。所以,并行执行一般情况,较少的在OLTP场合中应用,因为通常我们并不希望某一个人占用过多的系统资源。

  1. 5.      参考资料

1)      Oracle 性能诊断艺术.Christian Antognini.2009

2)      Oracle 性能优化求生指南.Guy Harrison .2012

  1. 6.      附:索引重建并行对比测试

--无并行

22:26:19 SQL> exec Zl1_Datamove_Reb(100, 1, 6);

PL/SQL procedure successfully completed

Executed in 2199.734 seconds

--------------------------------------------------------------

SQL> ALTER session FORCE PARALLEL DDL PARALLEL 24;

SQL> exec Zl1_Datamove_Reb(100, 1, 6);

PL/SQL procedure successfully completed

Executed in 1450.828 seconds

--------------------------------------------------------------

SQL> ALTER session FORCE PARALLEL DDL PARALLEL 16;

SQL> exec Zl1_Datamove_Reb(100, 1, 6);

PL/SQL procedure successfully completed

Executed in 1272.063 seconds

--------------------------------------------------------------

SQL> ALTER session FORCE PARALLEL DDL PARALLEL 8;

SQL> exec Zl1_Datamove_Reb(100, 1, 6);

PL/SQL procedure successfully completed

Executed in 1018.765 seconds

--------------------------------------------------------------

SQL> ALTER session FORCE PARALLEL DDL PARALLEL 4;

SQL> exec Zl1_Datamove_Reb(100, 1, 6);

PL/SQL procedure successfully completed

Executed in 1125.719 seconds

Oracle并行执行特性应用初探的更多相关文章

  1. 如何取得Oracle并行执行的trace

    如何取得Oracle并行执行的trace: ALTER SESSION SET tracefile_identifier='10046_PROD';ALTER SESSION SET max_dump ...

  2. 如何测试Oracle并行执行的并行度状况

    如何测试Oracle并行执行的并行度状况: 可以通过如下的脚本,来查看要求的并行度,和实际获得的并行度. 脚本来自: http://askdba.org/weblog/forums/topic/que ...

  3. ORACLE数据库特性

    目录 ORACLE数据库特性 一.学习路径 二.ORACLE的进程情况 三.ORACLE服务器的启动和关闭 (SQLPLUS环境挂起和恢复等) 连接Oracle的几种方式 四.几个关注点 1. ORA ...

  4. 全面学习ORACLE Scheduler特性(12)使用Windows和Window Groups

    七.使用Windows 此Windows非彼Windows,通常说的Windows是指盖首富的操作系统,而此处所说的Windows,是指SCHEDULER特性中的一个子项.在SCHEDULER中,WI ...

  5. 全面学习ORACLE Scheduler特性(11)使用Job Classes

    六.使用Job Classes Job Classes 相当于创建了一个job组,DBA可以将那些具有相同特性的job,统统放到相同的Job Classes中,然后通过对Job Class应用ORAC ...

  6. 全面学习ORACLE Scheduler特性(5)Schedules调度Programs执行的Jobs

    3.2 Schedules调度Programs执行的Jobs 通过schedule调度program的执行的job,看到这样的形容是不是让你彻底晕头了,就说明你还是没搞明白10g中SCHEDULERS ...

  7. 全面学习ORACLE Scheduler特性(1)创建jobs

    所谓出于job而胜于job,说的就是Oracle 10g后的新特性Scheduler啦.在10g环境中,ORACLE建议使用Scheduler替换普通的job,来管理任务的执行.其实,将Schedul ...

  8. oracle事务特性详解

    原子性 事务是一个完整的操作.事务的各步操作是不可分的(原子的):要么都执行,要么都不执行. -- 创建表 create table account_money ( id number(4) not ...

  9. 全面学习ORACLE Scheduler特性(9)创建Chains

    五.使用Chains 今天要来认识一位新同学:CHAIN(注意不要敲成CHINA).CHAIN可以被视做一组Programs的复合,举个简单的例子:运行PROGRAM:A以及PROGRAM:B,如果成 ...

随机推荐

  1. ERROR actor.OneForOneStrategy: org.apache.spark.SparkContext

    今天在用Spark把Kafka的数据往ES写的时候,代码一直报错,错误信息如下: 15/10/20 17:28:56 ERROR actor.OneForOneStrategy: org.apache ...

  2. mysql数据库中如何修改已建好的表中的【列名】【列的属性】

    sql命令:alter table tbl_name change old_col_name new_col_name data_type not null auto_increment primar ...

  3. go 版本 gRPC 环境搭建(3.0正式版)

    之前装过 gRPC 的各个测试版本,有些残余的文件,正式版的安装和之前残留的清除整理如下:   安装 go 版本的 gRPC go 的安装略过.需要 go 1.5 以上版本. $ go version ...

  4. linux命令-cp/scp {拷贝}

    一 命令解释 名称:cp 使用权限:所有使用者 使用方式: cp [options] source dest cp [options] source... directory 命令参数: -a 尽可能 ...

  5. 使用delphi+intraweb进行微信开发1~4代码示例

    前几讲重点阐述的是使用iw进行微信开发的技术难点及解决方法,提供的都是代码片段(微信消息加解密是完整代码),实际上我始终感觉按照教程实作是掌握一门技术的最重要的方法!不过对于刚刚接触这类开发的朋友来说 ...

  6. mysql通过sql文件导入数据时出现乱码的解决办法

    首先在新建数据库时一定要注意生成原数据库相同的编码形式,如果已经生成可以用phpmyadmin等工具再整理一次,防止数据库编码和表的编码不统一造成乱码. 方法一: 通过增加参数 –default-ch ...

  7. Ubuntu16.04 apache2 wsgi 部署django

    在Ubuntu16.04上部署django其实还算简单直观,最重要的问题就是路径设置正确,并且保证版本统一,这个测试是在 Apache/2.4.18 (Ubuntu)  apt-get install ...

  8. IOS 中openGL使用教程3(openGL ES 入门篇 | 纹理贴图(texture)使用)

    在这篇文章中,我们将学习如何在openGL中使用纹理贴图. penGL中纹理可以分为1D,2D和3D纹理,我们在绑定纹理对象的时候需要指定纹理的种类.由于本文将以一张图片为例,因此我们为我们的纹理对象 ...

  9. Lucene.net 高亮显示搜索词

    网站搜索关键词,往往搜索的结果中,要把用户搜索的词突出显示出来,这就是高亮搜索词的含义.而lucene也恰恰支持这样的操作.在此,我用的是盘古的组件,代码如下: PanGu.HighLight.Sim ...

  10. zookeeper入门学习

    1.基本概念 ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件.它是一个为分布式应用提供一致性服务的 ...