一、Corosync和pacemaker的了解:

Corosync是集群管理套件的一部分,他在传递信息的时候可以通过一个简单的配置文件来定义信息传递的方式和协议等。也就是说,corosync是Messaging Layer集群信息层软件,需要pacemaker资源管理器,才能构成一个完整的高可用集群。它也是运行于心跳层的开源软件。(是集群框架引擎程序)

 Pacemaker也就是Cluster Resource Manager(简称CRM),,是一个集群资源管理器。它利用群集基础构建(corosync或heartbeat)提供的消息和成员管理能力来探测并从节点或资源级别的故障中恢复,以实现群集服务的最大可用性。

Pacemaker和corosync,前者用于资源的转移,后者用于心跳的检测。结合起来使用,实现对高可用架构的自动管理。心跳检测使用来检测服务器是否还在提供服务,若出现服务器异常,就认为它挂掉了,此时pacemaker将会对资源进行转移。

Crmsh是pacemaker的命令行工具。

二、高可用集群的配置(实现环境:关闭selinux和火墙)

主要实现的是,在server1和server4上安装corosync和pacemaker,当一个节点服务器出问题,则另一个节点服务器进行服务。

1)在server1和server4中安装pacemaker和corosync

--->  yum  install pacemaker  corosync  -y

2)在server1中配置corosync的配置文件,完成后复制到server4中

--->  cp /etc/corosync/corosync.conf.example /etc/corosync/corosync.conf

         --->  vim  /etc/corosync/corosync.conf          #修改内容如下

  # Please read the corosync.conf.5 manual page 

  compatibility: whitetank

totem {
          version: 2          # 表示配置文件的版本
          secauth: off        # 表示集群认证关闭
          threads: 0          # 并发开启的线程数
          interface {         # 接口信息
                  ringnumber: 0
                  bindnetaddr: 172.25.2.0              # 集群工作的网段
                  mcastaddr: 226.94.1.1                # 多播地址
                  mcastport: 5405                      # 多播端口号(注意,在多个人使用时,修改自己的端口号或多播地址,防止结点添加在自己的集群中)
                  ttl: 1
          }
  }
  logging {       # 配置日志存储部分
          fileline: off
          to_stderr: no
          to_logfile: yes
          to_syslog: yes
          logfile: /var/log/cluster/corosync.log
          debug: off

          timestamp: on
          logger_subsys {
                  subsys: AMF
                  debug: off
          }
  }

amf {
          mode: disabled
  }
  service {       # 启动corosync之后启动pacemaker;若var为1的时候,需要手动启动pacemaker
          name: pacemaker
          ver: 0 
  }

   --->  scp  /etc/corosync/corosync.conf  server4:/etc/corosync/corosync.conf

   3)在server1和server4中安装crm软件(软件包需要在网上下载)

   --->  yum  install   -y  crmsh-1.2.6.0.rc2.2.1.x86_64.rpm  pssh-2.3.1-4.1.x86_64.rpm

     4)开启服务 (server1和server4均需要启动)   

   --->  /etc/init.d/corosync  start     # 当corosync启动后,pacemaker也会启动

   5)检测crm(出现结点1和结点4,代表结点添加成功)

   6)两个节点均crm_verify -VL 校验(会出现如下提示信息)

   --->  crm_verify  -LV      

   # 出现错误时,我们可以设置STONITH的值,消除错误(Stonith 即shoot the other node in the head使Heartbeat软件包的一部分, 该组件允许系统自动地复位一个失败的服务器使用连接到一个健康的服务器的遥远电源设备。 Stonith设备是一种能够自动关闭电源来响应软件命令的设备 )

   7)我们在server4中添加策略(ip和apache),在server1中进行监控

   # 首先添加vip (完成之后,可以在server1的监控中看到)

   # 添加参数,当结点server1坏掉的时候,server4会自动接管(也相当于忽略结点的检测)

   在server1中执行 /etc/init.d/corosync  stop后,在server4中监控结果为:

   # 添加spache服务在集群中(警告:默认时间和自己设置的监控时间不同,忽略,它会以默认时间为准);但此时cpahce和vip不在同一主机上,需建立资源组,把vip和apache服务添加进去;(注意,添加进去的服务不需要手动启动,pacamaker会帮我们启动)

   此时,server4中监控的情况为

   7)此时,apache的高可用已经配置完成,我们可以进行测试。当运行的节点有问题时,会http会自动切换到另一个节点上。

   # 修改node1为standy(停止节点node1),此时浏览器中显示的server4

三、含fence设备的高可用实现

   在server1和server4中查看,是否有key文件。

   1)在真机中安装软件

   --->  yum  search  fence-cirtd        #查找相关软件

   --->  yum  install -y yum install  -y fence-virtd-libvirt.x86_64  fence-virtd-multicast.x86_64 fence-virtd.x86_64

   --->  mkdir  /etc/cluster             # 创建密码生成目录

   --->  cd  /etc/cluster 

   --->  fence_virtd  -c                 # 生成配置文件       
  Module search path [/usr/lib64/fence-virt]: 回车

Available backends:
      libvirt 0.1
  Available listeners:
      multicast 1.2
 
  Listener modules are responsible for accepting requests
  from fencing clients.

Listener module [multicast]: 回车(默认为多播)

The multicast listener module is designed for use environments
  where the guests and hosts may communicate over a network using
  multicast.

The multicast address is the address that a client will use to
  send fencing requests to fence_virtd.
 
  Multicast IP Address [225.0.0.12]: 回车(多播ip)

Using ipv4 as family.

Multicast IP Port [1229]: 回车(多播接口)

Setting a preferred interface causes fence_virtd to listen only
  on that interface.  Normally, it listens on all interfaces.
  In environments where the virtual machines are using the host
  machine as a gateway, this *must* be set (typically to virbr0).
  Set to 'none' for no interface.

Interface [br0]: 回车(此处为自己真机的ip设备名称)

The key file is the shared key information which is used to
  authenticate fencing requests.  The contents of this file must
  be distributed to each physical host and virtual machine within
  a cluster.

Key File [/etc/cluster/fence_xvm.key]: 回车(密钥位置,没有目录自己建立)

Backend modules are responsible for routing requests to
  the appropriate hypervisor or management layer.

Backend module [libvirt]:

Configuration complete.

=== Begin Configuration ===
  fence_virtd {
      listener = "multicast";
      backend = "libvirt";
      module_path = "/usr/lib64/fence-virt";
  }

listeners {
      multicast {
          key_file = "/etc/cluster/fence_xvm.key";
          address = "225.0.0.12";
          interface = "br0";
          family = "ipv4";
          port = "1229";
      }

}

backends {
      libvirt {
          uri = "qemu:///system";
      }
  }

=== End Configuration ===
  Replace /etc/fence_virt.conf with the above [y/N]? y(对配置进行覆盖保存)

   ---> dd  if=/dev/urandom  of=fence_xvm.key  bs=128  count=1         # 随机截取密码文件的大小

   --->  systemctl  start fence-virtd.service                          # 启动服务(要关闭火墙)

   2)将真机中生成的密钥发送给server1和server4

   --->  scp  /etc/cluster/fence_xvm.key  server1:/etc/cluster         # 若在server1或4中没有cluster目录。创建即可

   --->  scp  /etc/cluster/fence_xvm.key  server4:/etc/cluster 

   3)在server1和server4中执行stonith_admin  -l,查看是否有fence代理:fence_xvm。如果没有我们需要安装fence-virt-0.2.3-15.el6.x86_64,  

   --->  yum install  fence-virt-0.2.3-15.el6.x86_64   -y  

   4)在corosync的策略中添加fence(当节点有问题时,可以自启动) 

   crm(live)configure# primitive vmfence stonith:fence_xvm  params pamk_host_map="server1:vm1;server4:vm4"  op  monitor interval=1min

   4)在另一端监控情况如下:

   5)测试,此时当我们对虚拟机server4使用命令--->  echo c> /proc/sysrq-trigger 的时候,它会自动重启,并添加在可用节点里面。

   注意:当添加vmfence时,出现 vmfence_start_0 on server1 'unknown error' (1)错误的时候,我们可以进行如下操作:(对之前的数据进行清除)

Corosync+pacemaker实现集群的高可用的更多相关文章

  1. Centos 7 下 Corosync + Pacemaker + psc + HA-proxy 实现业务高可用

    一.介绍: 1.本博客Corosync + Pacemaker + psc + HA-proxy 实现业务高可用,以httpd 服务实现高可用为例. 2.架构思路 a.三台web 节点,功能:全部安装 ...

  2. 浅谈web应用的负载均衡、集群、高可用(HA)解决方案(转)

    1.熟悉几个组件 1.1.apache     —— 它是Apache软件基金会的一个开放源代码的跨平台的网页服务器,属于老牌的web服务器了,支持基于Ip或者域名的虚拟主机,支持代理服务器,支持安 ...

  3. 15套java架构师、集群、高可用、高可扩展、高性能、高并发、性能优化、Spring boot、Redis、ActiveMQ、Nginx、Mycat、Netty、Jvm大型分布式项目实战视频教程

    * { font-family: "Microsoft YaHei" !important } h1 { color: #FF0 } 15套java架构师.集群.高可用.高可扩展. ...

  4. 15套java架构师、集群、高可用、高可扩 展、高性能、高并发、性能优化Redis、ActiveMQ、Nginx、Mycat、Netty、Jvm大型分布式项目实战视频教程

    * { font-family: "Microsoft YaHei" !important } h1 { color: #FF0 } 15套java架构师.集群.高可用.高可扩 展 ...

  5. hadoop 集群HA高可用搭建以及问题解决方案

    hadoop 集群HA高可用搭建 目录大纲 1. hadoop HA原理 2. hadoop HA特点 3. Zookeeper 配置 4. 安装Hadoop集群 5. Hadoop HA配置 搭建环 ...

  6. Rabbitmq安装、集群与高可用配置

    历史: RabbitMQ是一个由erlang开发的AMQP(Advanced Message Queue )的开源实现.AMQP 的出现其实也是应了广大人民群众的需求,虽然在同步消息通讯的世界里有很多 ...

  7. Nginx+Zuul集群实现高可用网关

    代码参考:https://github.com/HCJ-shadow/Zuul-Gateway-Cluster-Nginx Zuul的路由转发功能 前期准备 搭建Eureka服务注册中心 服务提供者m ...

  8. 11.Redis 哨兵集群实现高可用

    作者:中华石杉 Redis 哨兵集群实现高可用 哨兵的介绍 sentinel,中文名是哨兵.哨兵是 redis 集群机构中非常重要的一个组件,主要有以下功能: 集群监控:负责监控 redis mast ...

  9. Quartz学习笔记:集群部署&高可用

    Quartz学习笔记:集群部署&高可用 集群部署 一个Quartz集群中的每个节点是一个独立的Quartz应用,它又管理着其他的节点.这就意味着你必须对每个节点分别启动或停止.Quartz集群 ...

随机推荐

  1. Spark高级数据分析· 6LSA

    潜在语义分析 wget http://dumps.wikimedia.org/enwiki/latest/enwiki-latest-pages-articles-multistream.xml.bz ...

  2. CSS Outline(轮廓)

    CSS Outline(轮廓) 一.CSS 轮廓(outline) 轮廓(outline)是绘制于元素周围的一条线,位于边框边缘的外围,可起到突出元素的作用. CSS outline 属性规定元素轮廓 ...

  3. 20145324 《Java程序设计》第4周学习总结

    20145324 <Java程序设计>第4周学习总结 教材学习内容总结 第六章 1.继承是为避免多个类间重复定义共同行为 A extends B A继承B的行为 2.一个子类只能继承一个父 ...

  4. SVN一直提示需要clean up

    无论到那一级都提示clean up, 这是陷入clean up 死循环的结果. 解决办法: 使用任何一款可以连sqllit 的数据库管理软件例如(Navicat Premium),连入 项目跟目录/. ...

  5. SpringCloud Feign报错:Method has too many Body parameters

    1.feign多参数问题 1.1GET方式 错误写法 @RequestMapping(value="/test", method=RequestMethod.GET) Model ...

  6. ElasticSearch集群故障案例分析: 警惕通配符查询

    最近ElasticSearch集群出现了 https://elasticsearch.cn/article/171 文章中描述的情况,现在转载全文警示下自己. 许多有RDBMS/SQL背景的开发者,在 ...

  7. JDK 中的监控与故障处理工具-05 (jstack)

    jstack : stack trace for java jstack 命令用于生成虚拟机当前时刻的线程快照 (threaddump).线程快照是当前虚拟机中每一条线程正在执行的方法堆栈的集合,生成 ...

  8. TP5接受Vue跨域请求

    <?php /** * Created by PhpStorm. * User: qianglong * Date: 2018/1/15 * Time: 17:56 */ namespace a ...

  9. eclipse隐藏关闭的工程

    打开上面这个视图

  10. jmeter-time函数

    别人写的一个详解置顶 http://www.cnblogs.com/MasterMonkInTemple/p/3442770.html 新建beanshell,time函数格式${_time(YYYY ...