参考文档：

Install-guide：https://docs.openstack.org/install-guide/
OpenStack High Availability Guide：https://docs.openstack.org/ha-guide/index.html
理解Pacemaker：http://www.cnblogs.com/sammyliu/p/5025362.html
Ceph: http://docs.ceph.com/docs/master/start/intro/

六．Pacemaker cluster stack集群

Openstack官网使用开源的pacemaker cluster stack做为集群高可用资源管理软件。

详细介绍：https://docs.openstack.org/ha-guide/controller-ha-pacemaker.html

1. 安装pacemaker

# 在全部控制节点安装相关服务，以controller01节点为例；

# pacemaker：资源管理器（CRM），负责启动与停止服务，位于 HA 集群架构中资源管理、资源代理层

# corosync：消息层组件（Messaging Layer），管理成员关系、消息与仲裁，为高可用环境中提供通讯服务，位于高可用集群架构的底层，为各节点（node）之间提供心跳信息；

# resource-agents：资源代理，在节点上接收CRM的调度，对某一资源进行管理的工具，管理工具通常为脚本；

# pcs：命令行工具集；

# fence-agents：fencing 在一个节点不稳定或无答复时将其关闭，使其不会损坏集群的其它资源，其主要作用是消除脑裂

[root@controller01 ~]# yum install pacemaker pcs corosync fence-agents resource-agents -y

2. 构建集群

# 启动pcs服务，在全部控制节点执行，以controller01节点为例

[root@controller01 ~]# systemctl enable pcsd

[root@controller01 ~]# systemctl start pcsd

# 修改集群管理员hacluster（默认生成）密码，在全部控制节点执行，以controller01节点为例

[root@controller01 ~]# echo pacemaker_pass | passwd --stdin hacluster

# 认证配置在任意节点操作，以controller01节点为例；

# 节点认证，组建集群，需要采用上一步设置的password

[root@controller01 ~]# pcs cluster auth controller01 controller02 controller03 -u hacluster -p pacemaker_pass --force

# 创建并命名集群，在任意节点操作，以controller01节点为例；

# 生成配置文件：/etc/corosync/corosync.conf

[root@controller01 ~]# pcs cluster setup --force --name openstack-cluster-01 controller01 controller02 controller03

3. 启动

# 启动集群，以controller01节点为例

[root@controller01 ~]# pcs cluster start --all

# 设置集群开机启动

[root@controller01 ~]# pcs cluster enable --all

# 查看集群状态，也可使用” crm_mon -1”命令；

# “DC”：Designated Controller；

# 通过”cibadmin --query --scope nodes”可查看节点配置

[root@controller01 ~]# pcs status cluster

# 查看corosync状态；

# “corosync”表示一种底层状态等信息的同步方式

[root@controller01 ~]# pcs status corosync

# 查看节点；

# 或：corosync-cmapctl runtime.totem.pg.mrp.srp.members

[root@controller01 ~]# corosync-cmapctl | grep members

# 查看集群资源

[root@controller01 ~]# pcs resource

或通过web访问任意控制节点：https://172.30.200.31:2224，

账号/密码（即构建集群时生成的密码）：hacluster/pacemaker_pass

4. 设置属性

# 在任意控制节点设置属性即可，以controller01节点为例；

# 设置合适的输入处理历史记录及策略引擎生成的错误与警告，在troulbshoot时有用

[root@controller01 ~]# pcs property set pe-warn-series-max=1000 \

pe-input-series-max=1000 \

pe-error-series-max=1000 

# pacemaker基于时间驱动的方式进行状态处理，” cluster-recheck-interval”默认定义某些pacemaker操作发生的事件间隔为15min，建议设置为5min或3min

[root@controller01 ~]# pcs property set cluster-recheck-interval=5

# corosync默认启用stonith，但stonith机制（通过ipmi或ssh关闭节点）并没有配置相应的stonith设备（通过“crm_verify -L -V”验证配置是否正确，没有输出即正确），此时pacemaker将拒绝启动任何资源；

# 在生产环境可根据情况灵活调整，验证环境下可关闭

[root@controller01 ~]# pcs property set stonith-enabled=false

# 默认当有半数以上节点在线时，集群认为自己拥有法定人数，是“合法”的，满足公式：total_nodes < 2 * active_nodes；

# 以3个节点的集群计算，当故障2个节点时，集群状态不满足上述公式，此时集群即非法；当集群只有2个节点时，故障1个节点集群即非法，所谓的”双节点集群”就没有意义；

# 在实际生产环境中，做2节点集群，无法仲裁时，可选择忽略；做3节点集群，可根据对集群节点的高可用阀值灵活设置

[root@controller01 ~]# pcs property set no-quorum-policy=ignore

# v2的heartbeat为了支持多节点集群，提供了一种积分策略来控制各个资源在集群中各节点之间的切换策略；通过计算出各节点的的总分数，得分最高者将成为active状态来管理某个（或某组）资源；

# 默认每一个资源的初始分数（取全局参数default-resource-stickiness，通过"pcs property list --all"查看）是0，同时每一个资源在每次失败之后减掉的分数（取全局参数default-resource-failure-stickiness）也是0，此时一个资源不论失败多少次，heartbeat都只是执行restart操作，不会进行节点切换；

# 如果针对某一个资源设置初始分数”resource-stickiness“或"resource-failure-stickiness"，则取单独设置的资源分数；

# 一般来说，resource-stickiness的值都是正数，resource-failure-stickiness的值都是负数；有一个特殊值是正无穷大（INFINITY）和负无穷大（-INFINITY），即"永远不切换"与"只要失败必须切换"，是用来满足极端规则的简单配置项；

# 如果节点的分数为负，该节点在任何情况下都不会接管资源（冷备节点）；如果某节点的分数大于当前运行该资源的节点的分数，heartbeat会做出切换动作，现在运行该资源的节点将释 放资源，分数高出的节点将接管该资源

# pcs property list 只可查看修改后的属性值，参数”--all”可查看含默认值的全部属性值；

# 也可查看/var/lib/pacemaker/cib/cib.xml文件，或”pcs cluster cib”，或“cibadmin --query --scope crm_config”查看属性设置，” cibadmin --query --scope resources”查看资源配置

[root@controller01 ~]# pcs property list

5. 配置vip

# 在任意控制节点设置vip（resource_id属性）即可，命名即为“vip”；

# ocf（standard属性）：资源代理（resource agent）的一种，另有systemd，lsb，service等；

# heartbeat：资源脚本的提供者（provider属性），ocf规范允许多个供应商提供同一资源代理，大多数ocf规范提供的资源代理都使用heartbeat作为provider；

# IPaddr2：资源代理的名称（type属性），IPaddr2便是资源的type；

# 通过定义资源属性（standard:provider:type），定位”vip”资源对应的ra脚本位置；

# centos系统中，符合ocf规范的ra脚本位于/usr/lib/ocf/resource.d/目录，目录下存放了全部的provider，每个provider目录下有多个type；

# op：表示Operations

[root@controller01 ~]# pcs resource create vip ocf:heartbeat:IPaddr2 ip=172.30.200.30 cidr_netmask=24 op monitor interval=30s

# 查看集群资源

[root@controller01 ~]# pcs resourceprpr

# 通过”pcs resouce”查询，vip资源在controller01节点；

# 通过”ip a show”可查看vip

[root@controller01 ~]# ip a show eth0

6. High availability management

通过web访问任意控制节点：https://172.30.200.31:2224

账号/密码（即构建集群时生成的密码）：hacluster/pacemaker_pass

虽然以cli的方式设置了集群，但web界面默认并不显示，手动添加集群；实际操作只需要添加已组建集群的任意节点即可，如下：

# 如果api区分admin/internal/public接口，对客户端只开放public接口，通常设置两个vip，如命名为：vip_management与vip_public；

# 建议是将vip_management与vip_public约束在1个节点

# [root@controller01 ~]# pcs constraint colocation add vip_management with vip_public

七．Haproxy

1. 安装haproxy

# 在全部控制节点安装haproxy，以controller01节点为例；

# 如果需要安装最新版本，可参考：http://www.cnblogs.com/netonline/p/7593762.html

[root@controller01 ~]# yum install haproxy -y

2. 配置haproxy.cfg

# 在全部控制节点配置haproxy.cfg，以controller01节点为例；

# haproxy依靠rsyslog输出日志，是否输出日志根据实际情况设定；

# 备份原haproxy.cfg文件

[root@controller01 ~]# cp /etc/haproxy/haproxy.cfg /etc/haproxy/haproxy.cfg.bak

# 集群的haproxy文件，涉及服务较多，这里针对涉及到的openstack服务，一次性设置完成，如下：

[root@controller01 ~]# grep -v ^# /etc/haproxy/haproxy.cfg

global

  chroot  /var/lib/haproxy

  daemon

  group  haproxy

  user  haproxy

  maxconn  4000

  pidfile  /var/run/haproxy.pid

defaults

  log  global

  maxconn  4000

  option  redispatch

  retries  3

  timeout  http-request 10s

  timeout  queue 1m

  timeout  connect 10s

  timeout  client 1m

  timeout  server 1m

  timeout  check 10s

# haproxy监控页

listen stats

  bind 0.0.0.0:1080

  mode http

  stats enable

  stats uri /

  stats realm OpenStack\ Haproxy

  stats auth admin:admin

  stats  refresh 30s

  stats  show-node

  stats  show-legends

  stats  hide-version

# horizon服务

 listen dashboard_cluster

  bind 172.30.200.30:80

  balance  source

  option  tcpka

  option  httpchk

  option  tcplog

  server controller01 172.30.200.31:80 check inter 2000 rise 2 fall 5

  server controller02 172.30.200.32:80 check inter 2000 rise 2 fall 5

  server controller03 172.30.200.33:80 check inter 2000 rise 2 fall 5

# mariadb服务；

# 设置controller01节点为master，controller02/03节点为backup，一主多备的架构可规避数据不一致性；

# 另外官方示例为检测9200（心跳）端口，测试在mariadb服务宕机的情况下，虽然”/usr/bin/clustercheck”脚本已探测不到服务，但受xinetd控制的9200端口依然正常，导致haproxy始终将请求转发到mariadb服务宕机的节点，暂时修改为监听3306端口

listen galera_cluster

  bind 172.30.200.30:3306

  balance  source

  mode    tcp

  server controller01 172.30.200.31:3306 check inter 2000 rise 2 fall 5

  server controller02 172.30.200.32:3306 backup check inter 2000 rise 2 fall 5

  server controller03 172.30.200.33:3306 backup check inter 2000 rise 2 fall 5

# 为rabbirmq提供ha集群访问端口，供openstack各服务访问；

# 如果openstack各服务直接连接rabbitmq集群，这里可不设置rabbitmq的负载均衡

 listen rabbitmq_cluster

   bind 172.30.200.30:5673

   mode tcp

   option tcpka

   balance roundrobin

   timeout client  3h

   timeout server  3h

   option  clitcpka

   server controller01 172.30.200.31:5672 check inter 10s rise 2 fall 5

   server controller02 172.30.200.32:5672 check inter 10s rise 2 fall 5

   server controller03 172.30.200.33:5672 check inter 10s rise 2 fall 5

# glance_api服务

 listen glance_api_cluster

  bind 172.30.200.30:9292

  balance  source

  option  tcpka

  option  httpchk

  option  tcplog

  server controller01 172.30.200.31:9292 check inter 2000 rise 2 fall 5

  server controller02 172.30.200.32:9292 check inter 2000 rise 2 fall 5

  server controller03 172.30.200.33:9292 check inter 2000 rise 2 fall 5

# glance_registry服务

 listen glance_registry_cluster

  bind 172.30.200.30:9191

  balance  source

  option  tcpka

  option  tcplog

  server controller01 172.30.200.31:9191 check inter 2000 rise 2 fall 5

  server controller02 172.30.200.32:9191 check inter 2000 rise 2 fall 5

  server controller03 172.30.200.33:9191 check inter 2000 rise 2 fall 5

# keystone_admin_internal_api服务

 listen keystone_admin_cluster

  bind 172.30.200.30:35357

  balance  source

  option  tcpka

  option  httpchk

  option  tcplog

  server controller01 172.30.200.31:35357 check inter 2000 rise 2 fall 5

  server controller02 172.30.200.32:35357 check inter 2000 rise 2 fall 5

  server controller03 172.30.200.33:35357 check inter 2000 rise 2 fall 5

# keystone_public _api服务

 listen keystone_public_cluster

  bind 172.30.200.30:5000

  balance  source

  option  tcpka

  option  httpchk

  option  tcplog

  server controller01 172.30.200.31:5000 check inter 2000 rise 2 fall 5

  server controller02 172.30.200.32:5000 check inter 2000 rise 2 fall 5

  server controller03 172.30.200.33:5000 check inter 2000 rise 2 fall 5

# 兼容aws ec2-api

 listen nova_ec2_api_cluster

  bind 172.30.200.30:8773

  balance  source

  option  tcpka

  option  tcplog

  server controller01 172.30.200.31:8773 check inter 2000 rise 2 fall 5

  server controller02 172.30.200.32:8773 check inter 2000 rise 2 fall 5

  server controller03 172.30.200.33:8773 check inter 2000 rise 2 fall 5

 listen nova_compute_api_cluster

  bind 172.30.200.30:8774

  balance  source

  option  tcpka

  option  httpchk

  option  tcplog

  server controller01 172.30.200.31:8774 check inter 2000 rise 2 fall 5

  server controller02 172.30.200.32:8774 check inter 2000 rise 2 fall 5

  server controller03 172.30.200.33:8774 check inter 2000 rise 2 fall 5

 listen nova_placement_cluster

  bind 172.30.200.30:8778

  balance  source

  option  tcpka

  option  tcplog

  server controller01 172.30.200.31:8778 check inter 2000 rise 2 fall 5

  server controller02 172.30.200.32:8778 check inter 2000 rise 2 fall 5

  server controller03 172.30.200.33:8778 check inter 2000 rise 2 fall 5

 listen nova_metadata_api_cluster

  bind 172.30.200.30:8775

  balance  source

  option  tcpka

  option  tcplog

  server controller01 172.30.200.31:8775 check inter 2000 rise 2 fall 5

  server controller02 172.30.200.32:8775 check inter 2000 rise 2 fall 5

  server controller03 172.30.200.33:8775 check inter 2000 rise 2 fall 5

 listen nova_vncproxy_cluster

  bind 172.30.200.30:6080

  balance  source

  option  tcpka

  option  tcplog

  server controller01 172.30.200.31:6080 check inter 2000 rise 2 fall 5

  server controller02 172.30.200.32:6080 check inter 2000 rise 2 fall 5

  server controller03 172.30.200.33:6080 check inter 2000 rise 2 fall 5

 listen neutron_api_cluster

  bind 172.30.200.30:9696

  balance  source

  option  tcpka

  option  httpchk

  option  tcplog

  server controller01 172.30.200.31:9696 check inter 2000 rise 2 fall 5

  server controller02 172.30.200.32:9696 check inter 2000 rise 2 fall 5

  server controller03 172.30.200.33:9696 check inter 2000 rise 2 fall 5

 listen cinder_api_cluster

  bind 172.30.200.30:8776

  balance  source

  option  tcpka

  option  httpchk

  option  tcplog

  server controller01 172.30.200.31:8776 check inter 2000 rise 2 fall 5

  server controller02 172.30.200.32:8776 check inter 2000 rise 2 fall 5

  server controller03 172.30.200.33:8776 check inter 2000 rise 2 fall 5

3. 配置内核参数

# 全部控制节点修改内核参数，以controller01节点为例；

# net.ipv4.ip_nonlocal_bind：是否允许no-local ip绑定，关系到haproxy实例与vip能否绑定并切换；

# net.ipv4.ip_forward：是否允许转发

[root@controller01 ~]# echo "net.ipv4.ip_nonlocal_bind = 1" >>/etc/sysctl.conf

[root@controller01 ~]# echo "net.ipv4.ip_forward = 1" >>/etc/sysctl.conf

[root@controller01 ~]# sysctl -p

4. 启动

# 开机启动是否设置可自行选择，利用pacemaker设置haproxy相关资源后，pacemaker可控制各节点haproxy服务是否启动

# [root@controller01 ~]# systemctl enable haproxy

[root@controller01 ~]# systemctl restart haproxy

[root@controller01 ~]# systemctl status haproxy

访问：http://172.30.200.30:1080/

5. 设置pcs资源

# 任意控制节点操作即可，以controller01节点为例；

# 添加资源lb-haproxy-clone

[root@controller01 ~]# pcs resource create lb-haproxy systemd:haproxy --clone

[root@controller01 ~]# pcs resource

# 设置资源启动顺序，先vip再lb-haproxy-clone；

# 通过“cibadmin --query --scope constraints”可查看资源约束配置

[root@controller01 ~]# pcs constraint order start vip then lb-haproxy-clone kind=Optional

# 官方建议设置vip运行在haproxy active的节点，通过绑定lb-haproxy-clone与vip服务，将两种资源约束在1个节点；

# 约束后，从资源角度看，其余暂时没有获得vip的节点的haproxy会被pcs关闭

[root@controller01 ~]# pcs constraint colocation add lb-haproxy-clone with vip

[root@controller01 ~]# pcs resource

通过high availability management查看资源相关的设置，如下：

高可用OpenStack（Queen版）集群-3.高可用配置(pacemaker&haproxy)的更多相关文章

分布式架构高可用架构篇_01_zookeeper集群的安装、配置、高可用测试
参考: 龙果学院http://www.roncoo.com/share.html?hamc=hLPG8QsaaWVOl2Z76wpJHp3JBbZZF%2Bywm5vEfPp9LbLkAjAnB%2B ...
Dubbo入门到精通学习笔记（十五）：Redis集群的安装（Redis3+CentOS）、Redis集群的高可用测试（含Jedis客户端的使用）、Redis集群的扩展测试
文章目录 Redis集群的安装(Redis3+CentOS) 参考文档 Redis 集群介绍.特性.规范等(可看提供的参考文档+视频解说) Redis 集群的安装(Redis3.0.3 + CentO ...
16套java架构师，高并发，高可用，高性能，集群，大型分布式电商项目实战视频教程
16套Java架构师,集群,高可用,高可扩展,高性能,高并发,性能优化,设计模式,数据结构,虚拟机,微服务架构,日志分析,工作流,Jvm,Dubbo ,Spring boot,Spring cloud ...
分布式架构高可用架构篇_03-redis3集群的安装高可用测试
参考文档 Redis 官方集群指南:http://redis.io/topics/cluster-tutorial Redis 官方集群规范:http://redis.io/topics/cluste ...
搭建高可用mongodb集群（一）——配置mongodb
在大数据的时代,传统的关系型数据库要能更高的服务必须要解决高并发读写.海量数据高效存储.高可扩展性和高可用性这些难题.不过就是因为这些问题Nosql诞生了. NOSQL有这些优势: 大数据量,可以通过 ...
Corosync+Pacemaker+DRBD+MySQL 实现高可用(HA)的MySQL集群
大纲一.前言二.环境准备三.Corosync 安装与配置四.Pacemaker 安装与配置五.DRBD 安装与配置六.MySQL 安装与配置七.crmsh 资源管理推荐阅读: Linux 高可用(H ...
浅谈web应用的负载均衡、集群、高可用(HA)解决方案（转）
1.熟悉几个组件 1.1.apache —— 它是Apache软件基金会的一个开放源代码的跨平台的网页服务器,属于老牌的web服务器了,支持基于Ip或者域名的虚拟主机,支持代理服务器,支持安 ...
15套java架构师、集群、高可用、高可扩展、高性能、高并发、性能优化、Spring boot、Redis、ActiveMQ、Nginx、Mycat、Netty、Jvm大型分布式项目实战视频教程
* { font-family: "Microsoft YaHei" !important } h1 { color: #FF0 } 15套java架构师.集群.高可用.高可扩展. ...
15套java架构师、集群、高可用、高可扩展、高性能、高并发、性能优化Redis、ActiveMQ、Nginx、Mycat、Netty、Jvm大型分布式项目实战视频教程
* { font-family: "Microsoft YaHei" !important } h1 { color: #FF0 } 15套java架构师.集群.高可用.高可扩展 ...
ZooKeeper集群的安装、配置、高可用测试
Dubbo注册中心集群Zookeeper-3.4.6 Dubbo建议使用Zookeeper作为服务的注册中心. Zookeeper集群中只要有过半的节点是正常的情况下,那么整个集群对外就是可用的.正是 ...

随机推荐

4199. [NOI2015]品酒大会【后缀数组+并查集】
Description 一年一度的“幻影阁夏日品酒大会”隆重开幕了.大会包含品尝和趣味挑战两个环节,分别向优胜者颁发“首席品酒家”和“首席猎手”两个奖项,吸引了众多品酒师参加.在大会的晚餐上,调酒师 ...
Java基础加强之集合
集合整体框架图各集合框架的概述 1. Collection(常用List和Set,不常用Queue和Vector),单元素集合. 2. Map(常用HashMap和TreeMap,不常用HashTa ...
A NB群友【记忆化搜索】（2019年华南理工大学程序设计竞赛（春季赛））
冲鸭!去刷题:https://ac.nowcoder.com/acm/contest/625/A 题目描述 CC是著名的算法竞赛选手,他不仅人长得帅,而且技术了得,自然而然就有了许多粉丝. 为了能帮助 ...
DevOps 解读
本文为转载文章, 非原创 DevOps DevOps(Development和Operations的组合词)是一种重视“软件开发人员(Dev)”和“IT运维技术人员(Ops)”之间沟通合作的文化.运 ...
理解Flux架构
本文摘自<Flux架构入门教程>和<谈一谈我对 React Flux 架构的理解>.也有自己的观点和总结.转载请注明出处. 一.Flux架构描述 1. Flux是什么 Flux ...
1、Orcal下载安装步骤图文详解
1.Orcal官方下载地址: https://www.oracle.com/technetwork/cn/database/enterprise-edition/downloads/index.htm ...
C++内存管理变革(6)：通用型垃圾回收器 - ScopeAlloc
本文已经迁移到:http://cpp.winxgui.com/cn:a-general-gc-allocator-scopealloc C++内存管理变革(6):通用型垃圾回收器 - ScopeAll ...
【gulp】Gulp的安装和配置及系列插件
注意:要安装俩次gulp(全局和本地):全局安装gulp是为了执行gulp任务,本地安装gulp则是为了调用gulp插件的功能. 之前由大牛帮忙配置的gulp来用.今天时间充裕,就和小伙伴一起动手配置 ...
win7-x64上MySql的初次安装
1.官网:https://dev.mysql.com/downloads/mysql/下载对应的zip包 2.将包解压缩到本地,如:F:\mysql\mysql-8.0.15-winx64 3.配置环 ...
Linux下onvif客户端获取ipc摄像头 GetServices：获取媒体地址（有的h265摄像头必须要这个接口）
GetServices:获取媒体地址(有些h265的摄像头必须用到这个接口,得到获取能力时没获取到的另一个媒体地址) 鉴权:但是在使用这个接口之前是需要鉴权的.ONVIF协议规定,部分接口需要鉴权,部 ...

高可用OpenStack（Queen版）集群-3.高可用配置(pacemaker&haproxy)