​ 案例说明: KingbaseES V8R3集群failover时两个cluster都会触发,但只有一个cluster会调用脚本去执行真正的切换流程,另一个有对应的打印,但不会调用脚本,只是走相关的流程去修改状态. 那么你需要确认一点,到底是主库还是备库的cluster在执行脚本,关键字:failover_stream.sh ,看cluster.log中有没有这个的名称.本案例通过主库系统宕机,分析了failover 切换过程. 适用版本: KingbaseES V8R3 集群节点状态信息:…
案例说明: KingbaseES V8R3集群,执行kingbase_monitor.sh启动集群,出现"two master"节点的故障,启动集群失败:通过手工sys_ctl启动各节点数据库服务后,并手工重启kingbasecluster(restartcluster.sh)服务,集群运行正常.故障现象如下图所示: 手工启动数据库服务流复制正常: 手工启动kingbasecluster服务集群状态正常: 适用版本: KingbaseES V8R3 一.问题分析: 1.分析kingba…
案例说明: 在KingbaseES V8R3集群的cluster.log日志中,经常会出现"ERROR: md5 authentication failed:DETAIL: password does not match"的错误信息,本案例复现了发生此错误的原因. 适用版本: KingbaseES V8R3 问题现象: cluster.log: 问题分析: 1.当通过system用户连接9999端口执行"show pool_nodes"时,需要访问集群kingbas…
​案例说明: KingbaseES 数据库支持用户自定义表空间的创建,并建议表空间的文件存储路径配置到数据库的data目录之外.本案例复现了,当用户自定义表空间存储路径配置到data下时,出现的故障问题. 适用版本: KingbaseES V8R3 Tips: 本次案例复现采用的是Kingbase V008R003C002B0290 版本,根据实施人员在现场反馈KingbaseES 8.7.3.160D的版本出现的故障信息不一致. 集群节点信息: 一.创建用户自定义表空间 1.主备库创建表空间存…
案例说明: 在容灾环境中,跨区域部署的异地备节点不会自主提升为主节点,在主节点发生故障或者人为需要切换时需要手动执行切换操作.若主节点已经失效,希望将异地备机提升为主节点. $bin/repmgr standby promote 适用版本: KingbaseES V8R6 集群节点信息: ID | Name | Role | Status | Upstream | repmgrd | PID | Paused? | Upstream last seen ----+---------+------…
​ 案例说明: 此案例是在KingbaseES V8R6集群环境下,当主库磁盘空间不足时,执行sys_rman备份,将集群的备库节点作为repo主机,执行备份,并将备份存储在备库的磁盘空间. 集群架构状态: [kingbase@node102 bin]$ ./repmgr cluster show ID | Name | Role | Status | Upstream | Location | Priority | Timeline | Connection string ----+-----…
案例说明: 在生产中,需要将KingbaseES V8R3集群转换为单实例架构,可以采用以下方式快速完成集群架构的迁移. 适用版本: KingbaseES V8R3 当前数据库版本: TEST=# select version(); VERSION ------------------------------------------------------------------------------------------------------------------------- Kin…
​ 数据库异常关闭时,数据库关闭时来不及或者没机会做checkpoint,则需要从上一个一致性检查的开始恢复.KingbaseES备机checkpoint是不能产生checkpoint WAL日志条目的,因为如果写这样类型的checkpoint的话,就会将接收的WAL打乱,那么日志将混乱,回放会出问题. 那么问题来了,备机支持checkpoint吗?它的checkpoint怎么做的? KingbaseES为了缩短恢复时间,备机上也支持checkpoint,即CreateRestartPoint.…
案例说明: 在一次KingbaseES V8R3集群切换分析中,运维人员执行了pcp_node_refresh,导致集群发生了failover的切换.此文档对pcp_node_refresh工具做了应用说明及测试,不建议在生产环境使用此工具. 适用版本: KingbaseES V8R3 一.pcp_node_refresh应用说明 1. pcp_node_refresh 必须要指定节点ID(就是show pool_nodes中查出来的id),刷新这个节点的状态.动作是将数据库踢出集群,然后再加入…
​ 案例说明: 本案例通过对KingbaseES V8R3集群failover切换过程进行观察,分析了主备库切换后wal日志的变化,对应用者了解KingbaseES V8R3(R6) failover切换过程有一定的帮助. 以下为现场案例: failover切换后主备库的wal日志信息: 新主库数据库服务启动故障:(sys_log) =如下所示,在sys_log中,新主库启动startup后,建立流复制,流复制的起始wal日志是:" 00000004000000050000002A",…