oracle异机恢复测试

(一)问题背景

最近在生产环境中，开发人员误操作，使用truncate将oracle数据库某个表的数据全部删除了，在删除之后，开发人员发现自己闯祸了，于是联系值班的DBA进行紧急数据恢复。

经过分析，表被truncate后，使用一般的闪回表、闪回查询、闪回事物等方法，是不可能将数据找回来的，可以使用闪回数据库、闪回数据归档的方法来进行恢复，但是通常在生产环境中，都不会开启这2个特性，所以剩下的只有使用RMAN进行数据恢复了。

对于使用RMAN进行数据恢复，可以在生产环境上直接进行，也可以恢复到其它机器上。

直接在生产环境上恢复：①需要停止生产数据库；②数据库需要保持一致性，比如说，我需要将数据库恢复到12：00，那么数据库中其他表的数据也将恢复到12点，有可能会丢失较多数据；③如果恢复过程中出现其它问题也比较麻烦，耽误了生产业务执行。
恢复到其它机器上：②不需要停生产库；②仅仅丢失truncate表的数据，比如说，我需要将数据库恢复到12：00，那么我只需将整个库在测试环境上恢复到12点，再将我们丢失表的数据通过DB_LINK或数据泵等方式恢复到生产环境，生产环境其它表的数据是不受影响的；③恢复失败，并不会影响到生产库。

所以，经过一番考虑，决定将数据库恢复到其它机器上，然后再将truncate表的数据导回到生产环境。

此次恢复操作是同事做的，在恢复过程中，由于流程不熟悉，查资料耽误了一些时间（大约20分钟），虽然数据库恢复完成了，但没有达到快速恢复的要求。思考了一下，假如自己来做，能否在开发人员焦急等待的情况下，自己毫不慌乱、快速稳定的完成数据库恢复？确实是不可能的。一方面恢复流程不熟练，毕竟数据库恢复操作一年也不可能遇到几次，另一方面在用户及开发人员催促的情况下，DBA也很容易慌张，影响效率。因此最好的方式是：提前演练、写好操作流程。当故障发生时，照着文档操作，以最快的速度恢复生产。

（二）环境准备

	生产环境	异机环境
操作系统	RedHat6.7	RedHat6.7
数据库版本	11.2.0.4（RAC,2个节点）	11.2.0.4(单节点)
db_name	prodb	prodb
instance_name	prodb1、prodb2	prodb
数据库安装情况	安装GI+数据库软件+创建数据库	安装GI+数据库软件（不用创建数据库）
磁盘组信息	OCR : 31GB，normal DATA ：35GB，external ARCH : 1*5GB，external	OCR : 31GB，normal DATA ：35GB，external ARCH : 1*5GB，external

备注：为了方便，在后续环境中，生产环境数据库简称“生产库”，异机环境的数据库简称“测试库”。

（三）测试方案

（四）详细执行过程

（4.1）创建测试表

这里创建了2个测试表，作用分别如下：

lijiaman.test01：用于做truncate测试的表，最后在测试库需要进行test01表的恢复。

lijiaman.test02：用于模拟数据库事务，对该表不断执行插入操作，使得数据库产生大量归档日志。

（Ⅰ）表test01，一共有14笔数据。

SQL> CREATE TABLE test01 AS SELECT * FROM scott.emp;

Table created

SQL> select count(*) from test01;

  COUNT(*)

----------

        14

（ⅠⅠ）表test02，持续往里面写入数据

--创建表test02

create table test02

(

    col1      number,

    col2      number,

    col3      varchar2(30),

    col4      date,

    col5      varchar2(100)

);

--创建随机数据插入存储过程

create or replace procedure p_insert_test02 is

BEGIN

  FOR i IN 1..10000 LOOP

  insert into test02(col1,col2,col3,col4,col5)

  values

    ((select round(dbms_random.value(1, 100000000)) from dual),

     (select round(dbms_random.value(10000, 100000000)) from dual),

     (select dbms_random.string('a', 25) from dual),

     sysdate,

     (select dbms_random.string('a', 85) from dual));

  commit;

  END LOOP;

end  p_insert_test02;

--制定job，没隔30s执行一次上面的存储过程

declare

job1 number;

begin

sys.dbms_job.submit(job => job1,

what => 'p_insert_test02;',

next_date => sysdate,

interval => 'sysdate + 30/(1440*60)');                --每隔30s向test02表插入10000笔随机数据

commit;

end;

/

（4.2）对数据库进行完全备份

rman target /

RMAN> run {

allocate channel c1 type disk;

allocate channel c2 type disk;

sql' alter system archive log current';

backup database format '/databaseBackup/full_db_%U';

sql' alter system archive log current';

backup archivelog all format '/databaseBackup/archlog_%U';

backup current controlfile format '/databaseBackup/controlfile_%U';

backup spfile format '/databaseBackup/spfile_%U';

release channel c1;

release channel c2;

}

生成的备份集如下：

[oracle@node1 databaseBackup]$ ls -l
total 4136752
-rw-r----- 1 oracle asmadmin 1451128832 Sep 27 19:27 archlog_0iucr7hg_1_1
-rw-r----- 1 oracle asmadmin 1462116352 Sep 27 19:27 archlog_0jucr7hh_1_1
-rw-r----- 1 oracle asmadmin     1406464   Sep 27 19:27 archlog_0kucr7lr_1_1
-rw-r----- 1 oracle asmadmin   18841600   Sep 27 19:28 controlfile_0lucr7m2_1_1
-rw-r----- 1 oracle asmadmin 805953536   Sep 27 19:25 full_db_0eucr7f7_1_1
-rw-r----- 1 oracle asmadmin 477528064   Sep 27 19:25 full_db_0fucr7f7_1_1
-rw-r----- 1 oracle asmadmin   18841600   Sep 27 19:25 full_db_0gucr7h3_1_1
-rw-r----- 1 oracle asmadmin        98304   Sep 27 19:25 full_db_0hucr7ha_1_1
-rw-r----- 1 oracle asmadmin        98304   Sep 27 19:28 spfile_0mucr7m5_1_1

确认归档日志备份情况，可以看到，本次全备份归档日志备份到了thread1:57,thread2:48。

RMAN> list archivelog all;

List of Archived Log Copies for database with db_unique_name PRODB
=====================================================================

Key     Thrd Seq     S Low Time
------- ---- ------- - ---------
3            1    6       A 24-SEP-19
        Name: +ARCH/prodb/archivelog/2019_09_24/thread_1_seq_6.258.1019832847
......
100        1     57      A 27-SEP-19
        Name: +ARCH/prodb/archivelog/2019_09_27/thread_1_seq_57.355.1020108489

1           2     1       A 24-SEP-19
        Name: +ARCH/prodb/archivelog/2019_09_24/thread_2_seq_1.256.1019830885
......
80         2     48      A 24-SEP-19
        Name: +ARCH/prodb/archivelog/2019_09_24/thread_2_seq_48.335.1019838555

（4.3）数据库正常运行，产生大量归档

由于日志序列号是递增的（以resetlogs打开数据库例外），因此查询每个实例上生成的最大日志即可

SELECT *

FROM

(SELECT thread#,

       SEQUENCE#,

       NAME,

       ROW_NUMBER() OVER(PARTITION BY thread# ORDER BY SEQUENCE# DESC) rn

  FROM V$ARCHIVED_LOG)

WHERE rn=1;

结果为：

即thread1上的归档日志最大序列号为67，thread2上的归档日志最大序列号为48（这里因为个人电脑开较多虚拟机太卡，所以只开了节点1，节点2就没有日志生成，并不影响本次实验结果的准确性）。

（4.4）模拟test01表被truncate，记下时间

SQL> select sysdate from dual;

SYSDATE

-------------------

2019-09-27 19:37:31

SQL>

SQL> truncate table test01;

Table truncated.

（4.5）数据库正常运行，产生大量归档

上一次备份到了sequence=57的日志，上一次备份后又生成了25个日志，这里生成大量日志是为了模拟生产数据库这次交易的情况。

（4.6）开发人员发现表数据被truncate

开发人员发现程序报错，查看表test01，发现数据全没了，开发人员确认数据被自己删除（假设）。

（4.7）DBA执行异机恢复

思路整理：

本次恢复，需要将test01表恢复到truncate之前，我们需要有执行truncate操作之前的数据库全备和归档备份。第一次全备归档日志文件之备份到了thread1=57，thread2=48，在执行全被之后，又生成了许多的日志文件，我们要将数据库恢复到truncate之前（这里以我们记录的时间2019-09-27 19:37:31 为恢复点），那么我们还需要新的日志来做恢复，需要的日志如下：

thread1:日志57~67肯定需要，日志67~82不一定需要；

thread2：由于节点未开启，不需要日志来做恢复。

step1:将生产库的备份集传到测试库

[oracle@node1 databaseBackup]$ scp * 192.168.10.66:/databaseBackup/

step2:对恢复需要的归档日志进行再次备份，得到缺少的归档日志

run {

allocate channel c1 type disk;

sql' alter system archive log current';

backup archivelog all format '/databaseBackup/archlog_20190927_%U';

release channel c1;

}

得到的归档日志备份集如下：

-rw-r----- 1 oracle asmadmin 1621476864 Sep 27 20:50 archlog_20190927_0nucrcd2_1_1
-rw-r----- 1 oracle asmadmin 1643560960 Sep 27 20:51 archlog_20190927_0oucrcg5_1_1
-rw-r----- 1 oracle asmadmin 1581030912 Sep 27 20:53 archlog_20190927_0pucrcjj_1_1

传送到备库上
[oracle@node1 databaseBackup]$ scp archlog_20190927_0* 192.168.10.66:/databaseBackup/
step3:根据生产库的pfile，构造一个测试库的pfile

[oracle@test dbs]$ pwd

/u01/app/oracle/product/11.2.0/db_1/dbs

[oracle@test dbs]$ vim init initprodb.ora

# 添加如下信息

audit_file_dest='/u01/app/oracle/admin/prodb/adump'

audit_trail='db'

compatible='11.2.0.4.0'

control_files='+DATA/prodb/controlfile/current.260.1019830577'

db_block_size=8192

db_create_file_dest='+DATA'

db_domain=''

db_name='prodb'

diagnostic_dest='/u01/app/oracle'

dispatchers='(PROTOCOL=TCP) (SERVICE=prodbXDB)'

enable_ddl_logging=TRUE

log_archive_dest_1='LOCATION=+arch'

log_archive_format='%t_%s_%r.dbf'

open_cursors=300

pga_aggregate_target=399507456

processes=200

remote_login_passwordfile='exclusive'

sessions=225

sga_target=1199570944

prodb.undo_tablespace='UNDOTBS1'

[oracle@test dbs]$ ls

hc_prodb.dat  hc_testdb1.dat  hc_testdb.dat  init.ora  initprodb.ora  lkTESTDB

创建pfile里面涉及到的路径：

[oracle@test ~]$ mkdir -p /u01/app/oracle/admin/prodb/adump

step4:将备库启动到nomount状态

[oracle@test ~]$ export ORACLE_SID=prodb

[oracle@test ~]$ sqlplus / as sysdba

SQL*Plus: Release 11.2.0.4.0 Production on Fri Sep 27 20:58:15 2019

Copyright (c) 1982, 2013, Oracle.  All rights reserved.

Connected to an idle instance.

SQL> startup nomount;

ORACLE instance started.

Total System Global Area 1202556928 bytes

Fixed Size            2252704 bytes

Variable Size          402653280 bytes

Database Buffers      788529152 bytes

Redo Buffers            9121792 bytes

SQL>

step5：将数据库添加到HA中，以便可以使用ASM存储

[oracle@test ~]$ srvctl add database -d prodb -o /u01/app/oracle/product/11.2.0/db_1

step6：恢复控制文件，修改pfile文件，重新启动数据库到mount状态

RMAN> restore controlfile from "/databaseBackup/controlfile_0lucr7m2_1_1";

注意：此时存在一个问题，我们在构造pfile文件的时候，里面填写了控制文件的位置，这个位置是生产库上的位置，我们执行控制文件恢复后，需要对参数文件中的control_files参数进行修改，修改方法如下：

--首先，确认contril file在asm中的位置，

ASMCMD> pwd

+data/prodb/controlfile

ASMCMD> ls -lt

Type         Redund  Striped  Time             Sys  Name

CONTROLFILE  UNPROT  FINE     SEP 27 21:00:00  Y    current.256.1020114329

--接下来，修改pfile文件的control_files参数

[oracle@test ~]$ cd $ORACLE_HOME/dbs

[oracle@test dbs]$ vim initprodb.ora

# 改control_files位置

control_files='+data/prodb/controlfile/current.256.1020114329'

--重启数据库到mount状态

[oracle@test ~]$ sqlplus / as sysdba

SQL*Plus: Release 11.2.0.4.0 Production on Fri Sep 27 21:17:26 2019

Copyright (c) 1982, 2013, Oracle.  All rights reserved.

Connected to:

Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production

With the Partitioning, Automatic Storage Management, OLAP, Data Mining

and Real Application Testing options

SQL> shutdown immediate

ORA-01507: database not mounted

ORACLE instance shut down.

SQL> startup mount

ORACLE instance started.

Total System Global Area 1202556928 bytes

Fixed Size            2252704 bytes

Variable Size          402653280 bytes

Database Buffers      788529152 bytes

Redo Buffers            9121792 bytes

Database mounted.

SQL>

step7：注册新的归档日志备份集到备库的控制文件中

RMAN> catalog backuppiece "/databaseBackup/archlog_20190927_0nucrcd2_1_1";

RMAN> catalog backuppiece "/databaseBackup/archlog_20190927_0oucrcg5_1_1";

RMAN> catalog backuppiece "/databaseBackup/archlog_20190927_0pucrcjj_1_1";

step8:恢复数据库到truncate之前

RMAN＞SQL"ALTER SESSION SET NLS_LANGUAGE=''AMERICAN''";

RMAN＞SQL"ALTER SESSION SET NLS_DATE_FORMAT=''YYYY-MM-DD HH24:MI:SS''";

RUN{

SET UNTIL TIME '2019-09-27 19:37:31';

RESTORE DATABASE;

RECOVER DATABASE;

}

step9：确认数据是已经否恢复回来

--先以只读方式打开数据库，如果有问题，还可以重新执行恢复

SQL> alter database open read only;

Database altered.

--确认数据是否找回来

SQL> select count(*) from lijiaman.test01;

  COUNT(*)

----------

    14

step10:如果没问题，关闭数据库，以resetlogs方式打开

SQL> shutdown immediate;

Database closed.

Database dismounted.

ORACLE instance shut down.

SQL> startup mount

ORACLE instance started.

Total System Global Area 1202556928 bytes

Fixed Size            2252704 bytes

Variable Size          402653280 bytes

Database Buffers      788529152 bytes

Redo Buffers            9121792 bytes

Database mounted.

SQL> alter database open resetlogs;

Database altered.

恢复完成。

（4.8）将恢复的数据导入到生产环境

可以使用expdp/impdp或者是dblink将数据从测试库导入到生产库中。

【完】

oracle异机恢复测试的更多相关文章

rman恢复方案和oracle异机恢复
这篇文章主要介绍了rman恢复方案和oracle异机恢复,需要的朋友可以参考下注:①恢复的前提是已经做好备份②完全恢复数据库是数据库遇到故障,在恢复时候没有丢失任何已经提交事物数据的恢复不完全恢复数 ...
ORACLE 异机恢复
有时候需要将大的数据库发布到客户现场或转移机器时,不得不考虑在异机上恢复已经调整.测试好的库. dumpdp 全备的方法虽然易用,但在处理对象.索引.空间的时候异常的出错,比如:见有些公司,建表.索引 ...
使用NBU进行oracle异机恢复
windows平台的异机恢复,目录不同 1.异机环境准备安装oracle介质安装nbu客户端在异机主机的host文件中添加nbu server主机和原主机信息 2.恢复spfile文件 C:\> ...
Oracle异机恢复
RMAN异机恢复注意事项:1.RMAN 异机恢复的时候,db_name必须相同. 如果说要想改成其他的实例名,可以在恢复成功后,用nid 命令修改. 实例名的信息会记录到控制文件里,所以如果在恢复的时 ...
Oracle之使用rman进行异机恢复测试记录
本次测试目的是从生产数据库导出rman备份然后在测试数据库恢复 1,拷贝备份至相应目录 2,进入rman rman target \ 3,关闭数据库 shutdown 4,以nomount模式启动数据 ...
oracle异机恢复参考官方文档
How to use Rman Duplicate on ASM/RAC/OMF/Single Instance (Doc ID 840647.1) How to perform Rman dupli ...
oracle异机恢复 open resetlogs 报：ORA-00392
参考文档:ALTER DATABASE OPEN RESETLOGS fails with ORA-00392 (Doc ID 1352133.1) 打开一个克隆数据库报以下错误: SQL> a ...
Hyper-V安装Oracle Linux6_4 Oracle db 12c并使用rman做异机恢复
本文记录在Windows Server 2012 R2上安装Oracle Enterprise Linux 6.4以及使用RMAN进行进行异机恢复的过程. Windows服务器增加Hyper-V功能 ...
Oracle 单实例迁移到 RAC 实例 -- 使用RMAN 异机恢复
Oracle 官网有关单实例迁移到RAC的一个步骤说明: How to Convert 10g Single-Instance database to 10g RAC using Manual Con ...

随机推荐

集群、限流、缓存 BAT 大厂无非也就是这么做
前言前阵子有网友询问,如何优化网站?这个问题真的很大,跟他简单的聊了一下,随便说了几点,觉得有必要整理一篇文章出来,正好前阵子在做爬虫博客,于是把大体思路分享出来,与大家互通有无,共同进步. 优化 ...
Linux 设置服务开机启动
首先来了解一下 service命令是Redhat Linux兼容的发行版中用来控制系统服务的实用工具,它以启动.停止.重新启动和关闭系统服务,还可以显示所有系统服务的当前状态. service +(自 ...
剑指Offer（二十八）：数组中出现次数超过一半的数字
剑指Offer(二十八):数组中出现次数超过一半的数字搜索微信公众号:'AI-ming3526'或者'计算机视觉这件小事' 获取更多算法.机器学习干货 csdn:https://blog.csdn. ...
pickle 都写文件
import pickle mylist=[[1,2,3,4,5,6,7],["abc","xyz","hello"],[1,2,3,4,5 ...
dmg文件转iso格式
1. 简介 dmg是MAC苹果机上的压缩镜像文件,相当于在Windows上常见的iso文件. dmg格式在苹果机上可以直接运行加载,在Windows平台上需要先转换为iso格式. 2. 转换工具本文 ...
洛谷P1196[NOI2002]银河英雄传说-并查集扩展
银河英雄传说题意:在并查集的基础上,还要求出同一集合的两个点的距离这道题用并查集自己是知道的,但是竟然可以这么骚的操作. 下面转自大佬的查详细题解初见这道题,首先想到的方法当然是直接模拟,模拟每 ...
CodeForces 1084D The Fair Nut and the Best Path
The Fair Nut and the Best Path 题意:求路径上的点权和 - 边权和最大, 然后不能存在某个点为负数. 题解: dfs一遍, 求所有儿子走到这个点的最大值和次大值. 我 ...
codeforces 816 C. Karen and Game（模拟+思维）
题目链接:http://codeforces.com/contest/816/problem/C 题意:给出一个矩阵,问能否从都是0的情况下只将一整行+1或者一整列+1变形过来,如果可以输出需要步数最 ...
字符编码与gcc 编译器的编码问题
最近在 vscode 中借助 gcc 编译器来配置 c 语言开发环境时,发现中文编码存在乱码问题.再加上最近学习到多字节字符与宽字符,搅在一起,搞得很乱,就把自己的理解写下来,供有需者参考吧. 1. ...
【Nginx】应用场景
一.概述二.Nginx虚拟主机配置 2.1 外网映射工具 2.2 基于虚拟主机配置域名 2.3 基于端口的虚拟主机三.Nginx配置反向代理 3.1 反向代理的作用 3.2 反向代理的好处 3.3 ...

oracle异机恢复测试

oracle异机恢复测试的更多相关文章

随机推荐

热门专题