​​关注嘉为科技,获取运维新知 Exchange后端数据库故障,一般都会是比较严重的紧急故障,因为这会直接影响到大面积用户的正常使用,而且涉及到用户数据.一旦遇到这种级别的故障,管理员往往都是在非常紧张.压力非常大的状态下进行恢复操作,需要在高压状态下迅速做出决策,下一步应该如何做.本文将总结数据库紧急故障下的恢复思路,希望对遇到这种紧急情况的邮件系统管理员有所帮助. 注:以下案例仅针对Exchange 2010版本. 一般邮件数据库的紧急故障,首先判断数据库状态是否正常,是否可以挂载使用:数据…
​ 案例说明: KingbaseES V8R3集群failover时两个cluster都会触发,但只有一个cluster会调用脚本去执行真正的切换流程,另一个有对应的打印,但不会调用脚本,只是走相关的流程去修改状态. 那么你需要确认一点,到底是主库还是备库的cluster在执行脚本,关键字:failover_stream.sh ,看cluster.log中有没有这个的名称.本案例通过主库系统宕机,分析了failover 切换过程. 适用版本: KingbaseES V8R3 集群节点状态信息:…
​案例说明: KingbaseES 数据库支持用户自定义表空间的创建,并建议表空间的文件存储路径配置到数据库的data目录之外.本案例复现了,当用户自定义表空间存储路径配置到data下时,出现的故障问题. 适用版本: KingbaseES V8R3 Tips: 本次案例复现采用的是Kingbase V008R003C002B0290 版本,根据实施人员在现场反馈KingbaseES 8.7.3.160D的版本出现的故障信息不一致. 集群节点信息: 一.创建用户自定义表空间 1.主备库创建表空间存…
案例说明: 在KingbaseES V8R6集群备库执行"repmgr standby switchover"时,切换失败,并且在执行过程中,伴随着"repmr standby follow"操作,本案例详细记录了解决此问题的过程. 适用版本: KingbaseES V8R6 集群节点信息: 一.备库执行switchover操作 1.执行switchover切换 [kingbase@node101 bin]$ ./repmgr standby switchover…
案例说明: KingbaseES V8R3集群,执行kingbase_monitor.sh启动集群,出现"two master"节点的故障,启动集群失败:通过手工sys_ctl启动各节点数据库服务后,并手工重启kingbasecluster(restartcluster.sh)服务,集群运行正常.故障现象如下图所示: 手工启动数据库服务流复制正常: 手工启动kingbasecluster服务集群状态正常: 适用版本: KingbaseES V8R3 一.问题分析: 1.分析kingba…
案例说明: 在容灾环境中,跨区域部署的异地备节点不会自主提升为主节点,在主节点发生故障或者人为需要切换时需要手动执行切换操作.若主节点已经失效,希望将异地备机提升为主节点. $bin/repmgr standby promote 适用版本: KingbaseES V8R6 集群节点信息: ID | Name | Role | Status | Upstream | repmgrd | PID | Paused? | Upstream last seen ----+---------+------…
案例说明: 在KingbaseES V8R3集群的cluster.log日志中,经常会出现"ERROR: md5 authentication failed:DETAIL: password does not match"的错误信息,本案例复现了发生此错误的原因. 适用版本: KingbaseES V8R3 问题现象: cluster.log: 问题分析: 1.当通过system用户连接9999端口执行"show pool_nodes"时,需要访问集群kingbas…
CentOS6系统下,普通用户使用sudo执行命令时报错: xxx is not in the sudoers file.This incident will be reported" 解决方法就是在/etc/sudoers文件里给该用户添加权限.如下: 1.切换到root用户下 2./etc/sudoers文件默认是只读的,对root来说也是,因此需先添加sudoers文件的写权限,命令是:chmod u+w /etc/sudoers 3.编辑sudoers文件vim /etc/sudoers…
HTTP协议的Cache -Control指定请求和响应遵循的缓存机制.在请求消息或响应消息中设置 Cache-Control并不会影响另一个消息处理过程中的缓存处理过程.请求时的缓存指令包括: no-cache.no-store.max-age. max-stale.min-fresh.only-if-cached等.响应消息中的指令包括: public.private.no-cache.no- store.no-transform.must-revalidate.proxy-revalida…
虎牙直播运维负责人张观石 本文是根据虎牙直播运维负责人张观石10月20日在msup携手魅族.Flyme.百度云主办的第十三期魅族开放日<虎牙直播平台SRE实践>演讲中的分享内容整理而成. 张观石,拥有10余年网站开发.架构.运维经验:目前关注互联网服务可靠性系统工程.运维平台的规划建设.网站高可用架构等方面:在音视频传输质量评估.微服务运维方面积累了丰富的经验. 目录 一. 直播平台的架构及运维挑战 (一) 音视频传输流程及挑战 (二) 一个直播间的流程 (三) 直播平台的运维挑战 二. 我们…