环境:AIX 6.1 + Oracle 10.2.0.4

现象:在XTTS迁移测试阶段,遇到执行几个expdp的导出任务,迟迟没有返回任何信息,对应日志无任何输出,查看任务状态:

  1. SQL>
  2. set lines 300
  3. col OWNER_NAME for a10
  4. col OPERATION for a15
  5. col JOB_MODE for a20
  6. col STATE for a15
  7. select * from dba_datapump_jobs;
  8. OWNER_NAME JOB_NAME OPERATION JOB_MODE STATE DEGREE ATTACHED_SESSIONS DATAPUMP_SESSIONS
  9. ---------- ------------------------------ --------------- -------------------- --------------- ---------- ----------------- -----------------
  10. SYS SYS_EXPORT_TRANSPORTABLE_01 EXPORT TRANSPORTABLE DEFINING 1 0 1
  11. SYS SYS_EXPORT_TRANSPORTABLE_02 EXPORT TRANSPORTABLE DEFINING 1 1 2
  12. SYS SYS_EXPORT_TRANSPORTABLE_03 EXPORT TRANSPORTABLE DEFINING 1 1 2
  13. SYS SYS_EXPORT_SCHEMA_01 EXPORT SCHEMA DEFINING 1 1 2
  14. SYS SYS_EXPORT_TRANSPORTABLE_04 EXPORT TRANSPORTABLE DEFINING 1 1 2
  15. SYS SYS_EXPORT_SCHEMA_02 EXPORT SCHEMA DEFINING 1 1 2
  16. 6 rows selected.

可以看到所有的expdp导出任务的STATE都停留在DEFINING状态。

1.牛刀小试清异常

先强制杀掉后台执行的所有expdp任务:

  1. ps -ef|grep expdp|grep -v grep|awk '{print $2}'|xargs kill -9

然后尝试删除这些表(其实应该在not running状态下删除)

  1. select 'drop table '||OWNER_NAME||'.'||JOB_NAME||' purge;' from dba_datapump_jobs where STATE='NOT RUNNING';
  2. drop table sys.SYS_EXPORT_TRANSPORTABLE_01 purge;
  3. ..

可这样是没有作用的,查询结果不变。

甚至尝试正常shutdown immediate停止数据库,也无法成功,告警日志看到有活动调用:

  1. Thu Nov 1 15:14:24 2018
  2. Active call for process 4522064 user 'oracle' program 'oracle@localhost (DM00)'
  3. Active call for process 4456536 user 'oracle' program 'oracle@localhost (DM01)'
  4. Active call for process 10027180 user 'oracle' program 'oracle@localhost (DM02)'
  5. Active call for process 7340140 user 'oracle' program 'oracle@localhost (DM03)'
  6. Active call for process 6291888 user 'oracle' program 'oracle@localhost (DM04)'
  7. Active call for process 8126596 user 'oracle' program 'oracle@localhost (DM05)'
  8. SHUTDOWN: waiting for active calls to complete.

发现这些进程的id都对应了ora_dm的进程:

  1. $ ps -ef|grep ora_dm
  2. oracle 4456536 1 0 17:00:09 - 0:00 ora_dm01_xxxxdb
  3. oracle 4522064 1 0 16:50:57 - 0:00 ora_dm00_xxxxdb
  4. oracle 7340140 1 0 14:06:07 - 0:00 ora_dm03_xxxxdb
  5. oracle 8126596 1 0 14:35:03 - 0:00 ora_dm05_xxxxdb
  6. oracle 10027180 1 0 13:55:08 - 0:00 ora_dm02_xxxxdb
  7. oracle 6291888 1 0 14:31:17 - 0:00 ora_dm04_xxxxdb
  8. oracle 7340432 8388786 0 15:22:59 pts/4 0:00 grep ora_dm

实际上,这就是expdp任务的相关进程,强制杀掉这些进程:

  1. ps -ef|grep ora_dm|grep -v grep|awk '{print $2}'|xargs kill -9

之后数据库关闭成功:

  1. Thu Nov 1 15:24:37 2018
  2. All dispatchers and shared servers shutdown
  3. Thu Nov 1 15:24:37 2018
  4. ALTER DATABASE CLOSE NORMAL

启动数据库后,再次查询发现已经成功清理:

  1. SQL>
  2. set lines 300
  3. col OWNER_NAME for a10
  4. col OPERATION for a15
  5. col JOB_MODE for a20
  6. col STATE for a15
  7. select * from dba_datapump_jobs;
  8. no rows selected

小结:数据泵任务与ora_dm进程相关;如果数据泵任务发生异常,但任务并没有退出的情况,需要同时杀掉这类进程(杀掉后状态就会变为NOT RUNNING)。关库不是必须的,只是演示此时正常关闭被阻塞的场景。这也能说明为什么要保证在NOT RUNNING状态下才可以清理。

2.追本溯源查MOS

上面的步骤只是清理了异常的数据泵任务,但没有解决问题,再次后台执行备份任务依然会重现故障:
nohup sh expdp_xtts.sh &

  1. $ ps -ef|grep expdp
  2. oracle 6684914 8061208 0 15:30:07 pts/2 0:00 grep expdp
  3. oracle 7143482 8061208 0 15:30:03 pts/2 0:00 sh expdp_xtts.sh
  4. oracle 6685096 7143482 0 15:30:03 pts/2 0:00 expdp '/ as sysdba' parfile=expdp_xtts.par
  5. $ ps -ef|grep ora_dm
  6. oracle 7602308 8061208 0 15:30:10 pts/2 0:00 grep ora_dm
  7. oracle 3997964 1 1 15:30:05 - 0:00 ora_dm00_xxxxdb
  8. $

此时查询dba_datapump_jobs,state依然一直是defining状态:

  1. OWNER_NAME JOB_NAME OPERATION JOB_MODE STATE DEGREE ATTACHED_SESSIONS DATAPUMP_SESSIONS
  2. ---------- ------------------------------ --------------- ------------------------------ ------------------------------ ---------- ----------------- -----------------
  3. SYS SYS_EXPORT_TRANSPORTABLE_01 EXPORT TRANSPORTABLE DEFINING 1 1 2

其他的导出任务都一样,不再赘述。

为了方便测试,写一个简单的单表expdp导出,现象也一样。

  1. expdp \'/ as sysdba\' directory=XTTS tables=query.test dumpfile=query_test.dmp logfile=query_test.log

根据故障现象,用如下关键字在MOS中搜索: expdp state DEFINING,匹配到文档:

  • DataPump Export/Import Hangs With "DEFINING" Status When Using A Directory On NFS Filesystem (文档 ID 2262196.1)

正好这次测试是在NFS文件系统上,MOS建议移动到本地文件系统导出。

这次再将expdp进程全部杀掉:

  1. ps -ef|grep ora_dm|grep -v grep|awk '{print $2}'|xargs kill -9
  2. ps -ef|grep expdp|grep -v grep|awk '{print $2}'|xargs kill -9

此时查询dba_datapump_jobs:

  1. OWNER_NAME JOB_NAME OPERATION JOB_MODE STATE DEGREE ATTACHED_SESSIONS DATAPUMP_SESSIONS
  2. ---------- ------------------------------ --------------- ------------------------------ --------------- ---------- ----------------- -----------------
  3. SYS SYS_EXPORT_TABLE_04 EXPORT TABLE NOT RUNNING 0 0 0
  4. SYS SYS_EXPORT_SCHEMA_01 EXPORT SCHEMA NOT RUNNING 0 0 0
  5. SYS SYS_EXPORT_TABLE_02 EXPORT TABLE NOT RUNNING 0 0 0
  6. SYS SYS_EXPORT_TABLE_05 EXPORT TABLE NOT RUNNING 0 0 0
  7. SYS SYS_EXPORT_TABLE_03 EXPORT TABLE NOT RUNNING 0 0 0
  8. SYS SYS_EXPORT_TABLE_01 EXPORT TABLE NOT RUNNING 0 0 0
  9. SYS SYS_EXPORT_TRANSPORTABLE_01 EXPORT TRANSPORTABLE NOT RUNNING 0 0 0
  10. 7 rows selected.

清理NOT RUNNING的master表:

  1. select 'drop table '||OWNER_NAME||'.'||JOB_NAME||' purge;' from dba_datapump_jobs where STATE='NOT RUNNING';
  2. --执行结果用来执行,再次查看结果为空:
  3. SQL> select * from dba_datapump_jobs;
  4. no rows selected

按MOS建议,将导出任务移动到本地文件系统:

AIX源端导出XTTS源数据至源端/hxbak/xtts_exp目录中,而后copy至nfs共享存储/xtts/dmp中:

  1. mkdir /hxbak/xtts_exp
  2. chown oracle:dba /hxbak/xtts_exp
  3. ls -ld /hxbak/xtts_exp
  4. select * from dba_directories;
  5. create or replace directory XTTS as '/hxbak/xtts_exp';

此时测试expdp任务可正常运行:

  1. $ expdp \'/ as sysdba\' directory=XTTS tables=query.test dumpfile=query_test.dmp logfile=query_test.log
  2. Export: Release 10.2.0.4.0 - 64bit Production on Thursday, 01 November, 2018 16:03:21
  3. Copyright (c) 2003, 2007, Oracle. All rights reserved.
  4. Connected to: Oracle Database 10g Enterprise Edition Release 10.2.0.4.0 - 64bit Production
  5. With the Partitioning, OLAP, Data Mining and Real Application Testing options
  6. Starting "SYS"."SYS_EXPORT_TABLE_01": '/******** AS SYSDBA' directory=XTTS tables=query.test dumpfile=query_test.dmp logfile=query_test.log
  7. Estimate in progress using BLOCKS method...
  8. Processing object type TABLE_EXPORT/TABLE/TABLE_DATA
  9. Total estimation using BLOCKS method: 8 MB
  10. Processing object type TABLE_EXPORT/TABLE/TABLE
  11. Processing object type TABLE_EXPORT/TABLE/STATISTICS/TABLE_STATISTICS
  12. . . exported "QUERY"."TEST" 6.743 MB 72593 rows
  13. Master table "SYS"."SYS_EXPORT_TABLE_01" successfully loaded/unloaded
  14. ******************************************************************************
  15. Dump file set for SYS.SYS_EXPORT_TABLE_01 is:
  16. /hxbak/xtts_exp/query_test.dmp
  17. Job "SYS"."SYS_EXPORT_TABLE_01" successfully completed at 16:03:57
  18. SQL> select * from dba_datapump_jobs;
  19. OWNER_NAME JOB_NAME OPERATION JOB_MODE STATE DEGREE ATTACHED_SESSIONS DATAPUMP_SESSIONS
  20. ---------- ------------------------------ --------------- ------------------------------ --------------- ---------- ----------------- -----------------
  21. SYS SYS_EXPORT_TABLE_01 EXPORT TABLE EXECUTING 1 1 3

再次导出其他元数据:

  1. #expdp_xtts.sh (about 5min)
  2. nohup sh expdp_xtts.sh &
  3. #expdp_xtts_other.sh(about 5min)
  4. nohup sh expdp_xtts_other.sh &
  5. #expdp_tmp_table
  6. nohup sh expdp_tmp_table01.sh &
  7. nohup sh expdp_tmp_table02.sh &
  8. nohup sh expdp_tmp_table03.sh &
  9. nohup sh expdp_tmp_table04.sh &

最后将这些导出文件再移动到/xtts/dmp/下,供后续xtts测试目标端导入使用:

  1. $ pwd
  2. /hxbak/xtts_exp
  3. $ cp -rp * /xtts/dmp/

目标端导入时只需要有读这些文件的权限,即可,实际测试恢复OK。

小结:在自己的linux环境测试过是可以直接expdp到nfs文件系统的,AIX看来有区别,MOS的建议也只是一个workaround,但也能满足需求,毕竟元数据导出文件没多大。

记录一则expdp任务异常处理案例的更多相关文章

  1. PLSQL_数据泵导入进度查看Impdp/Expdp Status(案例)

    20150701 Created By BaoXinjian

  2. Python入门基础学习记录(二)汇率案例学习记录

    一.汇总整理 1.操作 ①新建python文件 工程右键--new--python file 2.注意问题与知识点 >变量定义:直接写变量名即可,例如定义一个字符串并赋值123: rmb_str ...

  3. 记录一则fsck的简单案例

    环境:RHEL 6.5 + ext4文件系统 我个人实验环境的一个虚拟机,开机时在Checking filesystems时,有报错: /dev/mapper/vg_linuxbase-lv_root ...

  4. django找不到模板(TemplateDoesNotExist at)的异常处理案例

    一.django的渲染模板时报如下错: TemplateDoesNotExist at 二.定位问题: 1.由上面报的错.一开始以为是找不到模板(自己路径写的不对).后来发现我的路径写的是正确的. 2 ...

  5. javascript中异常处理案例

    <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

  6. Android IOS WebRTC 音视频开发总结(四三)-- 诚信交易案例分享

    本文主要记录一些诚信交易的案例(两个陌生人之间没有合同,没有订金,没有讨价还价,完全靠诚信完成的交易), 特别纪录下来并不是因为金额有多高,而是因为在现在这种社会要完成这样的交易太难,特别是像咨询这种 ...

  7. MySQL(14):Select-limit(限制获得的记录数量)

    1. limit 限制获得记录的数量 2.limit 语法: (1) limit  offset, row_count: offset偏移量,从0开始. row_count总记录数. 分析: 案例演示 ...

  8. Hibernate介绍和入门案例

    一身转战三千里,一剑曾当百万师 如果你在之前没有学过SSH三大框架,那么你之前肯定是通过JDBC来对数据库进行操作.现在,你完全可以把跟数据库交互的操作直接交给Hibernate. Hibernate ...

  9. Java_异常处理

    这篇我们聊聊java中的异常.首先我们要知道什么是异常? Exception: exception翻译过来就是“意外”的意思.事实上,异常的本质就是程序的错误,包括程序逻辑错误和系统错误.错误在编写程 ...

随机推荐

  1. 1.7Oob 静态变量静态方法

    1)静态方法中可以直接调用同类中的静态成员,但不能直接调用非静态成员 2)如果希望在静态方法中调用非静态变量,可以通过创建类的对象,然后通过对象来访问非静态变量. 3)静态方法中不能直接调用非静态方法 ...

  2. Type Operators instanceof is used to determine whether a PHP variable is an instantiated object of a certain class/a class that implements an interface

    w 0-instanceof is used to determine whether a PHP variable is an instantiated object of a certain cl ...

  3. [troubleshoot][archliunx][chromium][flash] chrome提示flash不是最新

    最近chrome总是在提示flash不是最新要求更新. 原来以前用的flash包 chromium-pepper-flash 不见了,改名变成了pepper-flash. /home/tong [to ...

  4. 网易云课堂-spark

    ==============================Flink比spark优秀,但既生瑜何生亮,所以Flink没火起来 为了使用sortbykey,需要RDD的元素是key-value的形式 ...

  5. SRTP讨论

    1.接下来任务如何分工? 2.接下来要完成哪些工作? 硬件上要完成哪些? 1)环境数据的采集(我) 2)对小车的控制(我) 3)路径规划(喻) 4)小车的避障(雷) 5)环境数据的处理融合(我) 6) ...

  6. ODOO权限管理,在两个方面设置权限

    转载参考https://zhuanlan.zhihu.com/p/29130388 在odoo中新建两个用户user1,user2 新建用户 建完了用户,记得编辑用户,设置密码. 然后以user1用户 ...

  7. 配置ssm 时, web.xml 文件无 # 自动代码提示

    环境:STS 版本:spring-tool-suite-3.8.1.RELEASE-e4.6-win32-x86_64 配置ssm 时, web.xml 文件无 如下图蓝色圈范围内的提示 问题与 链接 ...

  8. day4_高效处理文件

    read()将文件内容从磁盘中全部读出,放到内存,再给cpu处理,性能低,如果文件量大,很容易内存溢出或卡死. 高效方式: 方式一:一般不用的,代码行多 f = open('users.txt','r ...

  9. LeetCode 700 Search in a Binary Search Tree 解题报告

    题目要求 Given the root node of a binary search tree (BST) and a value. You need to find the node in the ...

  10. P4491 [HAOI2018]染色

    题目链接:洛谷 题目大意:$n$个位置染$m$种颜色,如果出现次数恰为$S$次的颜色有$k$种,则对答案有$W_k$的贡献,求所有染色方案的答案之和$\bmod 1004535809$. 数据范围:$ ...