客户一套rac系统,三节点,其中一个节点的p260主机主板有问题(经常机器重启,好像是这个型号的通病,主板被炒到20W),临时把故障节点的vip作为业务地址用. 首先,查看确定故障节点vip飘到那个节点了: crsctl stat res -t ifconfig -a 接下来使用静态监听注册vip地址,来监听业务,添加,11.2 GI的LISTENER 监听器配置默认受到11.2新引入的endpoints_listener.ora配置文件的管理. 注意:使用 endpoints_listener…
昨天回公司加班跑一个LAXCUS大数据应用,JVM直接挂了,没有留下任何异常信息,查看代码,也没有内存泄漏的问题.百思不得姐,只好去求教LAXCUS大数据操作系统的技术客服,客服查看了故障节点配置.日志.JVM后,在启动文件site.sh中加一行参数:-XX:-ReduceInitialCardMarks ,然后再跑就没问题.FQ去google了一下,原来jdk1.5之前的垃圾回收都是串行化,后面版本为了更快GC,会判断机器运行环境,然后动态选择是串行GC还是并行GC.公司的服务器性能显然达到并…
ssh连接问题是由于主机ssh中缺少与jsch jar包匹配的加密算法导致,jsch jar包的默认加密算法貌似是diffie-hellman-group-exchange-sha1. 在目标主机ssh服务的sshd_config文件中添加下列加密算法并重启ssh服务即可解决ssh连接问题.KexAlgorithms diffie-hellman-group1-sha1,diffie-hellman-group14-sha1,diffie-hellman-group-exchange-sha1,…
研究了一段时间Consul,想写个攻略来着,但太赖了而且表达能力非正常人...今天发现HashiCorp果然接纳大众意见改了点东西.. 场景是: 假如Consul集群内有三个Server Node 时,当一个节点突然挂掉了,想要重连怎么办. 在之前的版本中方案有两种: 1.部署完集群后将consul-data\raft\peers.json内的文件先备份,等到有节点挂掉后将peers.json文件替换成之前备份的文件然后通过-rejoin 如:consul agent -server -conf…
11gR2 RAC重新启动后仅仅能起单节点 问题背景: 将11gR2 RAC正常部署完毕之后运行两节点重新启动操作发现当中有一个节点的集群资源无法启动,遂再次重新启动该无法启动集群资源的节点,还是不可.随即将正常节点重新启动发现原故障节点资源起来了,待重新启动完毕后原正常节点资源无法启动. 集群环境: OS:RedHat EnterPrise5.8 x86_x64 DB:Oracle EnterPrise Database 11.2.0.4.0 x86_x64 GRID:Oracle Grid…
原创作品,出自 "深蓝的blog" 博客,欢迎转载,转载时请务必注明以下出处,否则追究版权法律责任. 深蓝的blog:http://blog.csdn.net/huangyanlong/article/details/41480075 rac第二个节点重启后无法启动实例:磁盘组dismount问题 实验案例: 实验环境:CentOS 6.4.Oracle 11.2.0.1 现象重演:1. 重启第二节点服务器2. 手工启动第二节点实例,报错[root@node2 ~]# su - ora…
RAC 安装完成后,想修改ssh 的端口.google了一下.原文https://community.oracle.com/thread/2444594?tstart=0 原文说的是11g,10g也好使. 修改ssh 端口, cat /etc/ssh/sshd_config Port 2222 service sshd restart; 当然先前建立的等效性,更改之后是不好使了. 但是重新启动RAC的各项服务丝毫不收影响.如刘向兵所说RAC 安装完成后 节点间通信不依赖于SSH.…
本实验是在虚拟机中! 与实验同样的问题:http://blog.csdn.net/wanghui5767260/article/details/38850335 问题描写叙述: 节点1.节点2和节点3同一时候我做了断电处理,结果节点1 和节点2 都正常启动了,而节点3的vip在自己的节点上启动报错而在其它节点上启动正常. 注:节点3仅仅装入了集群. 查看状态: [root@rac3 bin]# ./crs_stat -t Name          Type           Target  …
1.故障现象 俩台服务器keepalived的vip在俩台服务器同时出现 A:10.70.12.72 B:10.70.12.73 2.问题分析 1).先分析那台服务器在提供服务 A:10.70.12.72 B:10.70.12.73 可以看到是B机器72在对外提供lvs转发服务 2).查看俩台服务器的keepalived日志 发现俩台的日志都是判断自己是master状态,证明俩者之间没有通过vrrp通信,来得到对方的状态信息 查看俩台服务器防火墙,发现B的防火墙没有关闭.关闭后发现keepali…
原文地址:http://blog.51cto.com/13599730/2161622 参考地址:https://blog.csdn.net/qq_14940627/article/details/79998931     防火墙没有放行keepalived的vrrp协议. 如何放行vrrp:https://www.cnblogs.com/ralphdc/p/7113491.html https://www.aliyun.com/jiaocheng/137678.html 本人最后将selinu…