​ 案例说明: KingbaseES V8R3集群failover时两个cluster都会触发,但只有一个cluster会调用脚本去执行真正的切换流程,另一个有对应的打印,但不会调用脚本,只是走相关的流程去修改状态. 那么你需要确认一点,到底是主库还是备库的cluster在执行脚本,关键字:failover_stream.sh ,看cluster.log中有没有这个的名称.本案例通过主库系统宕机,分析了failover 切换过程. 适用版本: KingbaseES V8R3 集群节点状态信息:…
案例说明: KingbaseES V8R3集群,执行kingbase_monitor.sh启动集群,出现"two master"节点的故障,启动集群失败:通过手工sys_ctl启动各节点数据库服务后,并手工重启kingbasecluster(restartcluster.sh)服务,集群运行正常.故障现象如下图所示: 手工启动数据库服务流复制正常: 手工启动kingbasecluster服务集群状态正常: 适用版本: KingbaseES V8R3 一.问题分析: 1.分析kingba…
案例说明: 在KingbaseES V8R3集群的cluster.log日志中,经常会出现"ERROR: md5 authentication failed:DETAIL: password does not match"的错误信息,本案例复现了发生此错误的原因. 适用版本: KingbaseES V8R3 问题现象: cluster.log: 问题分析: 1.当通过system用户连接9999端口执行"show pool_nodes"时,需要访问集群kingbas…
​案例说明: KingbaseES 数据库支持用户自定义表空间的创建,并建议表空间的文件存储路径配置到数据库的data目录之外.本案例复现了,当用户自定义表空间存储路径配置到data下时,出现的故障问题. 适用版本: KingbaseES V8R3 Tips: 本次案例复现采用的是Kingbase V008R003C002B0290 版本,根据实施人员在现场反馈KingbaseES 8.7.3.160D的版本出现的故障信息不一致. 集群节点信息: 一.创建用户自定义表空间 1.主备库创建表空间存…
案例说明: 在一次KingbaseES V8R3集群切换分析中,运维人员执行了pcp_node_refresh,导致集群发生了failover的切换.此文档对pcp_node_refresh工具做了应用说明及测试,不建议在生产环境使用此工具. 适用版本: KingbaseES V8R3 一.pcp_node_refresh应用说明 1. pcp_node_refresh 必须要指定节点ID(就是show pool_nodes中查出来的id),刷新这个节点的状态.动作是将数据库踢出集群,然后再加入…
案例说明: 在生产中,需要将KingbaseES V8R3集群转换为单实例架构,可以采用以下方式快速完成集群架构的迁移. 适用版本: KingbaseES V8R3 当前数据库版本: TEST=# select version(); VERSION ------------------------------------------------------------------------------------------------------------------------- Kin…
​ 案例说明: 本案例通过对KingbaseES V8R3集群failover切换过程进行观察,分析了主备库切换后wal日志的变化,对应用者了解KingbaseES V8R3(R6) failover切换过程有一定的帮助. 以下为现场案例: failover切换后主备库的wal日志信息: 新主库数据库服务启动故障:(sys_log) =如下所示,在sys_log中,新主库启动startup后,建立流复制,流复制的起始wal日志是:" 00000004000000050000002A",…
案例说明: 在KingbaseES V8R3主备流复制的集群中 ,一般有两个节点是集群的管理节点,分为master和standby:如对于一主二备的架构,其中有两个节点是管理节点,三个数据节点:管理节点运行kingbasecluster服务 ,负责集群节点状态的监控及集群主备切换等操作. 本案例详细介绍在一主一备的架构下,其中一个管理节点宕机的情况下,如何在线添加新的管理节点,如果宕机的节点是主备复制中的primary主库,将自动发生主备切换,所以在线添加的节点都是管理节点的备节点. 管理节点的…
案例说明: 在容灾环境中,跨区域部署的异地备节点不会自主提升为主节点,在主节点发生故障或者人为需要切换时需要手动执行切换操作.若主节点已经失效,希望将异地备机提升为主节点. $bin/repmgr standby promote 适用版本: KingbaseES V8R6 集群节点信息: ID | Name | Role | Status | Upstream | repmgrd | PID | Paused? | Upstream last seen ----+---------+------…
​ KingbaseES R3集群网关检测工作机制: 1.Cluster下watchdog进程在固定间隔时间,通过ping 网关地址监控链路的连通性,如果连通网关地址失败,则修改cluster status,比如将"master"修改为"lost",并摘除主节点的Cluster VIP. 2.在部署完成cluster后,会通过crond定时(每隔1分钟)运行network_rewind.sh脚本,在脚本通过函数checktrustip(),检测网关地址的连通性,如果…