VCS双机的配置目录:/etc/VRTSvcs/conf/config/main.cf

VCS双机的监控脚本目录:/opt/VRTSvcs/bin/mdcc/

VCS双机日志目录:/var/VRTSvcs/log

Xmanager 看:Linux双机命令:hagui&

Xmanager 看管双机的默认用户名/密码  admin/password

hastart -force

hastop -force

hastop -all -force

hasys -force hostname

hastatus -sum

有时启动VCS后,hastatus -sum无反应,日志中说GAB错的,通常由于心跳没配好:

1. vi /etc/llttab,通常有如下几行:

set-node mtymxsdpmsdp11 --主机名

set -cluster 400                  --Cluster组ID

link link1 eth0 -ether  --第一心跳,保证网卡顺序呢正确的前提下,这个铁定是eth0

link link2 bond1 -ether--第二心跳,绑定内外IP的网卡,就是192.168.0.*所在的网卡

link -lowpri link3 bond0 -ether --低优先级心跳,绑定外网IP的网卡,就是10.216.78.*所在的网卡

view /etc/llthosts,这里面是双机机器名,通常如下:

0 mtymxsdpmsp 15

1 mtymxsdpmsp 16

view /etc/gabtab,里面是一个命令:/sbin/gabconfig -c -n 2  --这个2是集群中主机数量

2:修改后cd /etc/rc.d目录执行:

./llt restart

./gab restart

双机概念:

双机之前至少要有两条独立的通信链路,心跳之间的通信决定哪些系统是集群的成员,集群中的资源和服务组的信息,通过广播更新到各个节点。

LLT:Low Latency Transport 低时延,传输协议,使用以太网的链路层,基于连接但不需要路由,提供内核到内核的快速通信

GAB:Group Membership Service/Atomic Broadcast 运行在LLT之上,使用广播维护集群状态、管理集群成员

HAD:这是VCS的引擎,通过GAB与集群的其他成员通信,维护整个集群所有资源的配置信息和状态信息由后台进程hashadow来监控,可认为had是agent的管理者,它使用agent来监视所有节点上的所有资源的状态。

常用命令:

运行lsmod|grep gab,若显示如下,则表明veritas启动所需llt、gab已经加载到内核中。

#lsmod|grep gab

gab              211684    3

intermodule  20868  2 gab,llt

否则检查/etc/llttab、/etc/llthosts、/etc/gabtab这三个文件是否正确,确认正确后,手动加载llt、gab,然后再运行lsmod|grep gab检查,确保llt、gab已加载到内核中。

在/opt/VRTS/bin 目录下运行 ./lltstat -nvv 查看主、备的llt运行情况,/etc/llttab里的各个link全部UP才行。

虽然有时hastatus -sum可以显示内容,但是Application Probed的时候两台服务器不能全部为1,此时也是所有link没有全部UP的原因,所以各个link一定要全部UP才行。

检查LLT模块

运行/sbin/lltconfig,检查LLT状态,若不是running,则检查/etc/llttab是否正确

并且这里配的网卡必须是UP状态,可用ifconfig查看

然后检查/etc/llthosts文件中的主机名是否正确,前面的主机序号需在0-31之内

若都OK,那运行lltstat -n检查是否所有的心跳线都OK,正确显示应该如下:

LLT node information:

Node state Links

*0 mdsp1 open 3

1 mdsp2 open 3

检查GAB模块

运行/sbin.gabconfig -a查看主、备的GAB状态,两台机器显示如下:

GAB Port Membership

Port a gen 459401 membership 01

Port h gen 349402 membership 01

如果gabconfig -a 提示GAB Port Memberships,需要检查/etc/gabtab文件是否正确

如果GAB一起动就关闭,那就是LLT的文件,如果没有h端口输入则表明HAD有问题

检查HAD

1、确认LLT、GAB是否正常启动;

2、运行hacf -verify /etc/VRTSvcs/conf/config,若运行后没有输出,则表明该目录下的main.cf正确

3、使用vxlicrep检查License是否正确,若出现vxlicrep ERROR V-21-3-1003,则需要重新输入License,使用命令vxlicinst,提示重新输入License

4、使用hastatus -sum检查各状态

只有保证llt、gab成功加载、Licence有效、main.cf文件正确后才能使用hatart(主、备都要执行)启动HAD

用hastatus -sum检查,显示如下表明VCS已成功启动:

--SYSTEM STATE

--System State Frozen

A mtymxsdpmsp15 RUNNING 0

A mtymxsdpmsp16 RUNNING 0

若VCS启动的时候资源组没有自动Online,则需要检查AutoStart、AutoStartList这两个属性 hagrp -display mdmc-rg

VCS的日志

VCS的引擎日志文件:/var/VRTSvcs/engine_A.log,agent代理日志文件也在这里,以代理的名字命名,例如IP_A.log

VCS的日志默认级别为error,可以使用hatype -modify res_type_LogLevel debug来更改日志级别。

查看资源组和资源状态:hastatus -sum

启动资源组:hargrp -online 资源组名 -sys 主机名

停止资源组:hargrp -offline 资源组名 -sys 主机名

切换资源组:hargrp -switch 资源组名 -to  主机名

停止双机软件和服务:hastop -all -force

启动双机软件和服务组:hastart

VCS双机原理的更多相关文章

  1. VCS双机+oracle 11gR2+ASM主机名修改

    ----------------------------------------------------------------------------VCS修改主机名---------------- ...

  2. 修改主机名后VCS的修改

    转:https://blog.csdn.net/nauwzj/article/details/6733135 一. 单机改主机名需更改以下文件: /etc/hosts /etc/hostname.hm ...

  3. 初识suse-Linux相关!

    Linux这种系统很奇怪,差不多每种不同的版本,它所使用的安装等一些重要命令皆有所变化.假若,你要熟练掌握一种OS,那么如果安装软件/应用,那是入门的第一步. 安装命令中: RedHat.CentOS ...

  4. NDMCDB数据库hang住故障分析 - cursor: pin S wait on X

    问题描写叙述: 上午刚刚到办公室,就有监控人员邮件反馈,昨晚NDMCDB407数据库被重新启动过,让我分析一下数据库重新启动的原因.因为昨晚业务有版本号上线,所以短信警告关闭了,所以没有短信下发到我手 ...

  5. (转)初识suse——linux

    Linux这种系统很奇怪,差不多每种不同的版本,它所使用的安装等一些重要命令皆有所变化.假若,你要熟练掌握一种OS,那么如果安装软件/应用,那是入门的第一步.   安装命令中: RedHat.Cent ...

  6. oracle_使用udev绑定磁盘方法

    scsi_id命令发出一个SCSI INQUIRY指令给设备,访问vital product data (VPD)页0x83的数据,那里包含设备的WWID和其他的信息,或者页0x80的数据,那里包含单 ...

  7. Oracle udev 绑定磁盘(转)

    scsi_id命令发出一个SCSI INQUIRY指令给设备,访问vital product data (VPD)页0x83的数据,那里包含设备的WWID和其他的信息,或者页0x80的数据,那里包含单 ...

  8. SUN巡检命令

    # hostname (主机名)# hostid# uname -X# uname -a # w (进程)# who# last# ps -eaf# /usr/ucb/ps -aux# prstat ...

  9. 学一点 mysql 双机异地热备份----快速理解mysql主从,主主备份原理及实践

    双机热备的概念简单说一下,就是要保持两个数据库的状态 自动同步.对任何一个数据库的操作都自动应用到另外一个数据库,始终保持两个数据库数据一致. 这样做的好处多. 1. 可以做灾备,其中一个坏了可以切换 ...

随机推荐

  1. 一个轻量级分布式 RPC 框架 — NettyRpc

    原文出处: 阿凡卢 1.背景 最近在搜索Netty和Zookeeper方面的文章时,看到了这篇文章<轻量级分布式 RPC 框架>,作者用Zookeeper.Netty和Spring写了一个 ...

  2. Ubuntu 安装 Telnet

    参考:在 ubuntu 上安裝 telnet service 1.安装: sudo apt-get install xinetd telnetd 2.修改inetd.conf: vim /etc/in ...

  3. POJ 2288 Islands and Bridges(状压dp)

    http://poj.org/problem?id=2288 题意: 有n个岛屿,每个岛屿有一个权值V,一条哈密顿路径C1,C2,...Cn的值为3部分之和: 第1部分,将路径中每个岛屿的权值累加起来 ...

  4. css3伪放大镜(图片放大动画)效果(鼠标移入圆形区域放大图片)

    源码: <!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8&q ...

  5. ZOJ-3962-数位dp

    http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemId=5594             16进制下的数位dp,由于固定了位数,可以出现前 ...

  6. 如何在.Net的MySqlCommand里面使用MySql用户自定义变量?

    Mysql使用@符号代表变量,但C#也恰好使用@代表用户自定义变量,这样两者就会正好冲突了. SELECT () AS rowId, u.*, r.RoleName FROM userinfo u L ...

  7. [Java] Eclipse下导入外部jar包的3种方式

    我们在用Eclipse开发程序的时候,经常要用到第三方jar包.引入jar包不是一个小问题,由于jar包位置不清楚,而浪费时间.下面配图说明3种Eclipse引入jar包的方式.   1.最常用的普通 ...

  8. Java LRU的实现

    最近在leetcode上做题的时,看到了一道有关LRU Cache的题目,正好我当初面试阿里巴巴的时候问到的.主要采用linkedHashMap来实现. package edu.test.algori ...

  9. PHP中实用的模式之【门面模式】

           author:胡旭个人博客        blog:http://www.ihuxu.com        欢迎关注~~~~ 对于一些逻辑稍微复杂的程序,很难避免出现在不某个类中无法访问 ...

  10. Alpha冲刺一 (8/10)

    前言 队名:拖鞋旅游队 组长博客:https://www.cnblogs.com/Sulumer/p/10023260.html 作业博客:https://edu.cnblogs.com/campus ...