PostgreSQL在使用过程中经常会发生一些失误的操作,但往往是可以弥补的。但是如果真遇到了无法挽回的误操作,只能寄希望于有备份了。

接下来的故障恢复也是基于有备份的情况,没有备份的情况,目前还没有想到怎么做

1.首先在数据库中配置日志归档

1)创建归档目录

mkdir -p /var/lib/pgsql/pg10/archive/

2)修改postgresql.conf文件

wal_level=replica
archive_mode = on
archive_command='test ! -f /var/lib/pgsql/9.10/archive/%f && cp %p /var/lib/pgsql/9.10/archive/%f'

3)重启数据库

pg_ctl restart

2.对数据库进行全量备份,这里只是为了测试,就简单的对目录进行拷贝即可

cp -r $PGDATA ~/pg10/full_back

3.对数据库进行操作 并记录对应的日志号

select txid_current();
txid_current
--------------
557
(1 row) now
-------------------------------
2018-09-03 18:07:14.288787+08
(1 row) delete first 100 tuple of run_command
DELETE 99
count
-------
99901
(1 row) select txid_current();
txid_current
--------------
559
(1 row) now
-------------------------------
2018-09-03 18:07:14.500745+08
(1 row) delete last 100 tuple of run_command
DELETE 100
count
-------
99801
(1 row) select txid_current();
txid_current
--------------
561
(1 row) now
-------------------------------
2018-09-03 18:07:14.571154+08
(1 row)
checkpoint
CHECKPOINT
pg_switch_wal
pg_switch_wal
---------------
0/3005FA0
(1 row) checkpoint
CHECKPOINT
pg_switch_wal
pg_switch_wal
---------------
0/40000E8
(1 row)

4.设置recovery.conf文件

restore_command = 'cp /var/lib/pgsql/pg10/archive/%f %p'
recovery_target_xid = '557'
recovery_target_inclusive = false
recovery_target_timeline = 'latest'

5.以为恢复成功了,结果发现系统只读,不能写,paused! 后续补充····,日志:

-bash-4.1$ cat log/postgresql-2018-09-03_181007.log
2018-09-03 18:10:07.160 CST [850] LOG: database system was interrupted; last known up at 2018-09-03 18:07:12 CST
2018-09-03 18:10:07.160 CST [850] LOG: creating missing WAL directory "pg_wal/archive_status"
cp: cannot stat `/var/lib/pgsql/pg10/archive/00000002.history': No such file or directory
2018-09-03 18:10:07.431 CST [850] LOG: starting point-in-time recovery to 2018-09-03 18:07:14.500745+08
2018-09-03 18:10:07.448 CST [850] LOG: restored log file "000000010000000000000002" from archive
2018-09-03 18:10:07.596 CST [850] LOG: redo starts at 0/2000028
2018-09-03 18:10:07.613 CST [850] LOG: consistent recovery state reached at 0/2003C30
2018-09-03 18:10:07.613 CST [848] LOG: database system is ready to accept read only connections

看其他人使用过程中遇到文件不存在时,会自动创建一个新的时间线,然后恢复完成,而他们都是用的10以前版本,可能因此造成的吧。

6.经过多次分析,在data目录的pg_wal中也没有发现 “00000002.history”文件,于是尝试重新回放日志,终于成功:

postgres=# select pg_wal_replay_resume();
pg_wal_replay_resume
---------------------- (1 row) postgres=# select pg_wal_replay_resume();
ERROR: recovery is not in progress
HINT: Recovery control functions can only be executed during recovery postgres=# select count(*) from run_command ;
count
-------
99901
(1 row) postgres=# insert into run_command values (1, 'test new');
INSERT 0 1
postgres=# \q

执行pg_wal_replay_resume()的日志:

-bash-4.1$ cat log/postgresql-2018-09-03_181007.log
2018-09-03 18:10:07.160 CST [850] LOG: database system was interrupted; last known up at 2018-09-03 18:07:12 CST
2018-09-03 18:10:07.160 CST [850] LOG: creating missing WAL directory "pg_wal/archive_status"
cp: cannot stat `/var/lib/pgsql/pg10/archive/00000002.history': No such file or directory
2018-09-03 18:10:07.431 CST [850] LOG: starting point-in-time recovery to 2018-09-03 18:07:14.500745+08
2018-09-03 18:10:07.448 CST [850] LOG: restored log file "000000010000000000000002" from archive
2018-09-03 18:10:07.596 CST [850] LOG: redo starts at 0/2000028
2018-09-03 18:10:07.613 CST [850] LOG: consistent recovery state reached at 0/2003C30
2018-09-03 18:10:07.613 CST [848] LOG: database system is ready to accept read only connections
2018-09-03 18:10:07.646 CST [850] LOG: restored log file "000000010000000000000003" from archive
2018-09-03 18:10:07.779 CST [866] LOG: duration: 28.273 ms statement: select count(*) from run_command
2018-09-03 18:10:07.797 CST [868] ERROR: cannot execute INSERT in a read-only transaction
2018-09-03 18:10:07.797 CST [868] STATEMENT: insert into run_command values(1, 'test new')
2018-09-03 18:10:07.804 CST [850] LOG: recovery stopping before commit of transaction 560, time 2018-09-03 18:07:14.52735+08
2018-09-03 18:10:07.804 CST [850] LOG: recovery has paused
2018-09-03 18:10:07.804 CST [850] HINT: Execute pg_wal_replay_resume() to continue.
2018-09-03 18:10:21.263 CST [870] LOG: duration: 0.697 ms statement: select pg_wal_replay_resume();
2018-09-03 18:10:21.818 CST [850] LOG: redo done at 0/3005E90
2018-09-03 18:10:21.818 CST [850] LOG: last completed transaction was at log time 2018-09-03 18:07:14.496615+08
cp: cannot stat `/var/lib/pgsql/pg10/archive/00000002.history': No such file or directory
2018-09-03 18:10:21.886 CST [850] LOG: selected new timeline ID: 2
cp: cannot stat `/var/lib/pgsql/pg10/archive/00000001.history': No such file or directory
2018-09-03 18:10:22.145 CST [850] LOG: archive recovery complete
2018-09-03 18:10:22.476 CST [848] LOG: database system is ready to accept connections
2018-09-03 18:10:22.775 CST [870] ERROR: recovery is not in progress
2018-09-03 18:10:22.775 CST [870] HINT: Recovery control functions can only be executed during recovery.
2018-09-03 18:10:22.775 CST [870] STATEMENT: select pg_wal_replay_resume();

7.然后又尝试了使用时间和恢复点来回放,都没问题。

8.附上recovery.conf文件的配置:

在恢复过程中,用户可以通过使用recovery.conf文件来指定恢复的各个参数,如下:

归档恢复设置
restore_command:用于获取一个已归档段的XLOG日志文件的命令
archive_cleanup_command:清除不在需要的XLOG日志文件的命令
recovery_end_command:归档恢复结束后执行的命令 恢复目标设置(默认情况下,数据库将会一直恢复到 WAL 日志的末尾)
recovery_target = ’immediate’:在从一个在线备 份中恢复时,这意味着备份结束的那个点
recovery_target_name (string):这个参数指定(pg_create_restore_point()所创建)的已命名的恢复点,将恢复到该恢复点
recovery_target_time (timestamp):这个参数指定恢复到的时间戳
recovery_target_xid (string):这个参数指定恢复到的事务 ID
recovery_target_inclusive (boolean):指定是否在指定的恢复目标之后停止(true),或者在恢复目标之前停止 (false);适用于recovery_target_time或者recovery_target_xid被指定的情况;这个设置分别控制事务是否有准确的目标提交时间或 ID 是否将被包括在该恢复中;默认值为 true
recovery_target_timeline (string):指定恢复到一个特定的时间线
recovery_target_action (enum):指定在达到恢复目标时服务器应该立刻采取的动作,包括pause(暂停)、promote(接受连接)、shutdown(停止服务器),其中pause为默认动作 备库参数设置
standby_mode(boolean):为on表示作为一个备库,否则不为备库
primary_conninfo (string):指定备库连接主库的连接字符串
primary_slot_name (string):通过流复制指定主库的一个复制槽来复制主库数据,如果没有设置primary_conninfo,则此参数无效
trigger_file (string):指定一个触发器文件,该文件存在可以结束备库的恢复,即升级备库为一个独立的主库
recovery_min_apply_delay (integer):这个参数允许将恢复延迟一段固定的时间,如果没有指定单位则以毫秒为单位。
如果recovery.conf中同时指定了recoveryTargetXid、recoveryTargetName、recoveryTargetTime时,PostgreSQL会按照RECOVERY_TARGET_XID> RECOVERY_TARGET_NAME > RECOVERY_TARGET_TIME的优先级来获取最终的目标恢复位点。 如果在recovery.conf指定recovery_targetTimeLine为latest,则可以基于当前TimeLineID为起点寻找最新时间线: 寻找当前TimeLineID的时间线历史文件“XXX.history”,如果存在则继续寻找,否则错误退出
TimeLineID是线性增长的,将当前TimeLineID自增1寻找是否存在时间线历史文件,直到不存在对应的时间线历史文件为止,即可找到最新的时间线。

后续准备找找如何在没有备份的情况下,恢复删除数据。。。。。。

PostgreSQL基于时间点故障恢复PITR( point-in-time recovery )的更多相关文章

  1. 7.5 Point-in-Time (Incremental) Recovery Using the Binary Log 使用binay log 基于时间点恢复

    7.5 Point-in-Time (Incremental) Recovery Using the Binary Log 使用binay log 基于时间点恢复 7.5.1 Point-in-Tim ...

  2. mysql基于“时间”的盲注

    无需页面报错,根据页面响应时间做判断! mysql基于时间的盲注 =================================================================== ...

  3. 表空间基于时间点的恢复(TSPITR)

    环境:RHEL 6.4 + Oracle 11.2.0.4 准备模拟环境 1. 验证表空间的依赖性 2. 确定执行TSPITR后会丢失的对象 3. 自动执行TSPITR Reference 准备模拟环 ...

  4. JavaScript基于时间的动画算法

    转自:https://segmentfault.com/a/1190000002416071 前言 前段时间无聊或有聊地做了几个移动端的HTML5游戏.放在不同的移动端平台上进行测试后有了诡异的发现, ...

  5. 7.5.1 Point-in-Time Recovery Using Event Times 使用Event Times 基于时间点恢复

    7.5.1 Point-in-Time Recovery Using Event Times 使用Event Times 基于时间点恢复 表明开始和结束时间用于恢复, 指定 --start-datet ...

  6. ORACLE调度之基于时间的调度(一)【weber出品】

    一.调度的概述 这里我看到一篇对调度的概述觉得描述的比我好,但仅限于概述部分,其他部分我觉得我讲的比他好,于是发生以下事情: ************************华丽的转载******** ...

  7. pfSense配置基于时间的防火墙规则

    基于时间的规则允许防火墙规则在指定的日期和/或时间范围内激活.基于时间的规则与任何其他规则的功能相同,只是它们在预定时间之外的规则集中实际上不存在. 基于时间的规则逻辑处理基于时间的规则时,调度计划确 ...

  8. Python:SQLMap源码精读—基于时间的盲注(time-based blind)

    建议阅读 Time-Based Blind SQL Injection Attacks 基于时间的盲注(time-based blind) 测试应用是否存在SQL注入漏洞时,经常发现某一潜在的漏洞难以 ...

  9. [Swift]LeetCode981. 基于时间的键值存储 | Time Based Key-Value Store

    Create a timebased key-value store class TimeMap, that supports two operations. 1. set(string key, s ...

随机推荐

  1. WPF和Sliverlight不同之UIElement-事件

    WPF: http://msdn.microsoft.com/en-us/library/System.Windows.UIElement.aspx DragEnter DragLeave DragO ...

  2. snapshot与release

    总结自:https://www.jianshu.com/p/084fd2408d9a 这两个概念是用于描述jar包,jar包提供给其他系统作为依赖. 1. snapshot版本代表不稳定.尚处于开发中 ...

  3. unsigned short A = 10; printf("~A = %u\n", ~A); char c=128; printf("c=%d\n",c); 输出多少?

    这是题目给出的答案:第一题,-A =0xfffffff5,int值 为-11,但输出的是uint.所以输出4294967285 第二题,c=0x10,输出的是int,最高位为1,是负数,所以它的值就是 ...

  4. oppo R9 WLAN使用代理图解

    以上拼图便是oppo R9 WLAN使用代理图解,代理设为 '手动' ,主机名便是我的电脑的ip地址,端口号是9973: + 9973端口号 (微信web开发者工具不可更改): + 8888 端口号 ...

  5. USB详解

    USB作为一种串行接口,应用日益广泛.如同每个工程设计人员必须掌握I2C,RS232这些接口一样,我们也必须掌握USB.但是USB的接口协议实在有点费解,Linux UCHI驱动作者之一Alan St ...

  6. kali2016.2安装后配置

    接触kali有几个月了,总是有一种浅尝辄止的感觉.因为不常用,一些常用操作时常想不起来了.为日后查找方便,特通过写博客方式来记录. 新建虚拟机,和安装其它操作系统差别不大,按提示一步一步安装.第1次安 ...

  7. ArrayBlockingQueue,LinkedBlockingQueue分析

    BlockingQueue接口定义了一种阻塞的FIFO queue,每一个BlockingQueue都有一个容量,让容量满时往BlockingQueue中添加数据时会造成阻塞,当容量为空时取元素操作会 ...

  8. RabbitMQ脑裂

    在RabbitMQ3.4.x中会出现脑裂的现象,本文通过实验验证此脑裂现象,愿小伙伴们少走弯路. Preview 网上有两篇帖子(需要FQ) https://groups.google.com/for ...

  9. KindEditor ctrl+v添加图片功能

    原理: 监听粘贴事件(paste) 获取粘贴版数据,读取到图片数据流进行加载base64 传到后台服务端直接输出为图片文件保存后返回图片读取路径插入编辑器中 /** * 获取编辑器对象 */ wind ...

  10. 管理账号密码的工具-KeePass使用方法

    附件链接:https://files.cnblogs.com/files/stxs/KeePass.zip 打开压缩包“KeePass.zip",将文件"KeePass.exe&q ...