案例说明: 在容灾环境中,跨区域部署的异地备节点不会自主提升为主节点,在主节点发生故障或者人为需要切换时需要手动执行切换操作.若主节点已经失效,希望将异地备机提升为主节点. $bin/repmgr standby promote 适用版本: KingbaseES V8R6 集群节点信息: ID | Name | Role | Status | Upstream | repmgrd | PID | Paused? | Upstream last seen ----+---------+------…
案例说明: KingbaseES V8R3集群,执行kingbase_monitor.sh启动集群,出现"two master"节点的故障,启动集群失败:通过手工sys_ctl启动各节点数据库服务后,并手工重启kingbasecluster(restartcluster.sh)服务,集群运行正常.故障现象如下图所示: 手工启动数据库服务流复制正常: 手工启动kingbasecluster服务集群状态正常: 适用版本: KingbaseES V8R3 一.问题分析: 1.分析kingba…
​ 案例说明: KingbaseES V8R3集群failover时两个cluster都会触发,但只有一个cluster会调用脚本去执行真正的切换流程,另一个有对应的打印,但不会调用脚本,只是走相关的流程去修改状态. 那么你需要确认一点,到底是主库还是备库的cluster在执行脚本,关键字:failover_stream.sh ,看cluster.log中有没有这个的名称.本案例通过主库系统宕机,分析了failover 切换过程. 适用版本: KingbaseES V8R3 集群节点状态信息:…
​案例说明: KingbaseES 数据库支持用户自定义表空间的创建,并建议表空间的文件存储路径配置到数据库的data目录之外.本案例复现了,当用户自定义表空间存储路径配置到data下时,出现的故障问题. 适用版本: KingbaseES V8R3 Tips: 本次案例复现采用的是Kingbase V008R003C002B0290 版本,根据实施人员在现场反馈KingbaseES 8.7.3.160D的版本出现的故障信息不一致. 集群节点信息: 一.创建用户自定义表空间 1.主备库创建表空间存…
案例说明: 在KingbaseES V8R3集群的cluster.log日志中,经常会出现"ERROR: md5 authentication failed:DETAIL: password does not match"的错误信息,本案例复现了发生此错误的原因. 适用版本: KingbaseES V8R3 问题现象: cluster.log: 问题分析: 1.当通过system用户连接9999端口执行"show pool_nodes"时,需要访问集群kingbas…
PB 级大规模 Elasticsearch 集群运维与调优实践 https://mp.weixin.qq.com/s/PDyHT9IuRij20JBgbPTjFA | 导语 腾讯云 Elasticsearch 被广泛应用于日志实时分析.结构化数据分析.全文检索等场景中,本文将以情景植入的方式,向大家介绍与腾讯云客户合作过程中遇到的各种典型问题,以及相应的解决思路与方法,希望与大家一同交流. 背景 某中型互联网公司的游戏业务,使用了腾讯云的 Elasticsearch 产品,采用 ELK 架构存储…
ssh免密登录 集群运维 生成秘钥,一路enter cd ~/.ssh/ ssh-keygen -t rsa 讲id_rsa.pub文件追加到授权的key文件中 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys 把第一台机器的authorized_keys文件复制到第二台机子上,把公钥给对方,才能免密登录远程服务器 scp authorized_keys root@172.16.92.128:~/.ssh/ 把第二台的公钥也追加 cat ~/.ss…
作者 | 姚捷(喽哥)阿里云容器平台集群管理高级技术专家 本文节选自<不一样的 双11 技术:阿里巴巴经济体云原生实践>一书,点击即可完成下载. 导读:值得阿里巴巴技术人骄傲的是 2019 年阿里巴巴 双11 核心系统 100% 以云原生的方式上云,完美支撑了 54.4w 峰值流量以及 2684 亿的成交量.背后承载海量交易的计算力就是来源于容器技术与神龙裸金属的完美融合. 集团上云机器资源形态 阿里巴巴 双11 采用三地五单元架构,除 2 个混部单元外,其他 3 个均是云单元.神龙机型经过…
案例说明: 在KingbaseES V8R6集群备库执行"repmgr standby switchover"时,切换失败,并且在执行过程中,伴随着"repmr standby follow"操作,本案例详细记录了解决此问题的过程. 适用版本: KingbaseES V8R6 集群节点信息: 一.备库执行switchover操作 1.执行switchover切换 [kingbase@node101 bin]$ ./repmgr standby switchover…
导语 | 腾讯云Elasticsearch 被广泛应用于日志实时分析.结构化数据分析.全文检索等场景中,本文将以情景植入的方式,向大家介绍与腾讯云客户合作过程中遇到的各种典型问题,以及相应的解决思路与方法,希望与大家一同交流.文章作者:bellen,腾讯云大数据研发工程师. ​ 一.背景 某中型互联网公司的游戏业务,使用了腾讯云的 Elasticsearch 产品,采用 ELK 架构存储业务日志. 因为游戏业务本身的日志数据量非常大(写入峰值在 100w qps ),在服务客户的几个月中,我们踩…