现场: 跑着数据库的主机A报警应用连接不上数据库,我们无法ssh到主机.第一反应是通过telnet到远程控制口,发现数据库资源和硬件资源在被切换到HA架构的主机B(备机,通常性能比主机A的差,抗不住应用).此时HA已经把数据库切到了备机上,勉强抗着应用. 分析: 一.查看故障机(主机A)的操作系统日志和oracle alert日志有大量的如下报错: OS: Mar 17 14:20:00 mktdb1 genunix: [ID 470503 kern.warning] WARNING: Sorr…
非常抱歉,今天凌晨 3:20~8:30 左右,我们使用的阿里云 RDS 实例 SQL Server 2016 标准版突然出现 CPU 100% 故障,造成全站无法正常访问,由此给您带来巨大的麻烦,请您谅解. 问题很奇怪,故障期间是数据库服务器负载极低的时间段.从阿里云 RDS 控制台 CloudDBA 看,故障期间下面的一个 SQL 语句大量执行,并且极其消耗 CPU . 开始我们以为是这个 SQL 语句引发的故障,但排查下来这个 SQL 语句本身并没有性能问题,而且已经使用了至少6个月. 最终…
新买的dell r430服务器,双CPU,64G内存,单CPU32g,swap 3G 出现故障现像:mysqldump时会hang住,innodb_buffer_pool_size        = 35G,数据量有187G 试验各种方法,最后发现关闭numa可正常导出 vi /etc/grub.conf ... numa=off 分析原因:单CPU只有32G,加交换3G=35G,需要分配的内存多于此数导致分配时hang住…
说“血案”有写夸张了,其实是也就熬了一夜的通宵,做运维的伤不起啊,作为一名运维工程师,像这种服务器突发故障半夜起床的情况属于家常便饭,见怪不怪了,开始说正事: 前几天半夜12点左右,收到服务器宕机的消息,然后用dell idrac 卡远程,结果无法通过它正常开机,直接发邮件给机房,让他们重置下idrac管理卡(就是拔掉电源线,过2分钟后再插回去), 机房操作好之后,可以连上服务器,结果还没好1分钟,机器又挂了,还是刚才的情况,据我分析应该是哪里硬件出问题了,再通知机房处理,这次机房人员反应,机器…
2013年8月22日23:50~23:58左右,由于阿里云SLB(负载均衡)故障造成网站不能正常访问,给大家带来了麻烦,望大家谅解! 8月19日我们收到阿里云的短信通知: 尊敬的阿里云用户:      您好!      负载均衡(SLB)将于8月22日22:00 至 23日00:00进行系统维护,维护期间SLB服务不可新建,控制台配置功能暂不可用.已经创建好的SLB服务不受影响.      给您造成不便,敬请谅解!感谢您对阿里云的支持! 当时看到通知中说“已经创建好的SLB服务不受影响”,我们也…
环境描述: 1.节点描述 节点 IP 节点描述 11.6.76.221 GG 抽取端 / DG 节点,数据库版本号为 Oracle-11.2.0.3,与 11.6.76.222 组成 DataGuard. 11.6.76.222 DG 节点,数据库版本号为 Oracle-11.2.0.3,与 11.6.76.221 组成 DataGuard. 192.168.87.221 GG 复制端,数据库版本号为 Oracle-11.2.0.4 2.拓扑结构   方案描述: 假设 11.6.76.221 最…
问题描述:    上一篇就是NameNode 的HA 部署完成,但是存在问题,问题是如果 主NameNode的节点宕机了,还是需要人工去使用命令来切换NameNode的Acitve 这样很不方便,所以 这篇学习笔记就是记录如何解决  故障转移的 启动以后每个都是Standby,选举一个为Active 监控  每个NameNode 都应该监控  (ZKFC   Failover  Controller  失败故障转移控制器) 开始进行配置 在hdfs-site.xml 文件中配置 : <prope…
function! CleverTab() , col( ) =~ '^\s*$' return "\<Tab>" else return "\<C-N>" endif endfunction inoremap <Tab> <C-R>=CleverTab()<CR> 当光标到行首都未出现非空白字符时,Tab还是Tab:否则,Tab就被映射为Ctrl+N的补全命令. 操作帮助:  vim  ~/.vimrc …
同事的excel文档,无法保存.总是提示什么要发送错误报告.错误报告中的错误信息包含event type:BXE.这个文件大小约1M多.工作簿中包含表大约有30张,表名称为中文.我去看了看,其他电子表格文件都正常.打开这个表格总是提示“此工作簿包含到其他数据源的链接”,问是否更新.解决步骤如下(包含尝试的步骤):步骤1:先是把计算机虚拟内存调大了,还是不行.步骤2:把文件拷贝到其他电脑,结果运行正常.但是一拿回原来电脑还是打不开.步骤3:将工作重点放在电子表格本身.查找“[”,因为表间引用都会有…