一、PXC方案概述

Percona XtraDB Cluster (PXC) 是一个完全开源的 MySQL 数据库集群解决方案,它可确保高可用性,防止停机和数据丢失,并为不断增长的环境提供线性可扩展性。它将 Percona Server 和 Percona XtraBackup 与 Galera 库集成在一起,以实现同步多源复制。

集群由节点组成,其中每个节点包含在节点间同步的相同数据集。推荐的配置是至少有 3 个节点,也可以有 2 个节点,但不建议使用2个节点。每个节点都是一个常规的 MySQL Server 实例。可以将现有的 MySQL Server 实例转换为节点,并使用该节点作为基础运行集群。还可以从集群中分离任何节点并将其用作常规 MySQL 服务器实例。

当执行查询时,它会在节点上本地执行。所有数据都在本地可用,无需远程访问。

没有中央管理。可以在任何时间点解绑任何节点,集群将继续运行而不会丢失任何数据。

PXC是扩展读取工作负载的好解决方案,可横向扩展以实现负荷降低。可以对任何节点进行读取查询。

新近实施的PXC集群版本均为 8.0,Percona XtraDB Cluster 8.0与MySQL Server Community Edition 8.0和Percona Server for MySQL 8.0完全兼容。

如图是3节点的架构,可以看到每个节点都支持读写。

二、PXC基础知识

■ PXC集群使用四个端口

端口 描述

3306 MySQL服务端口

4444 请求全量同步(SST)端口

4567 数据库节点之间的通信端口

4568 请求增量同步(IST)端口

因此如系统启用了防火墙则需开放这些端口,或者关闭防火墙

firewall-cmd --zone=public --add-port=3306/tcp --permanent

firewall-cmd --zone=public --add-port=4444/tcp --permanent

firewall-cmd --zone=public --add-port=4567/tcp --permanent

firewall-cmd --zone=public --add-port=4568/tcp --permanent

firewall-cmd --reload

■ 关于SST同步

Different from previous version

The variable wsrep_sst_auth has been removed. Percona XtraDB Cluster 8.0 automatically creates the system user mysql.pxc.internal.session. During SST, the user mysql.pxc.sst.user and the role mysql.pxc.sst.role are created on the donor node.

■ 节点状态定义

OPEN: 节点启动成功

PRIMARY: 节点成功加入集群

JOINER: 与其他节点同步数据

JOINED: 与其他节点同步数据成功

SYNCED: 与集群同步完成,可以对外提供服务

DONER: 接收其他节点的全量数据同步,处于不可用

【wsrep_local_state】当前节点状态,值为4表示正常

共有四个值:

joining:节点正在加入集群

doner: 节点处于为新加入节点提供全量数据时的状态

joined: 当前节点已成功加入集群

synced: 当前节点与集群中各节点是同步状态

【wsrep_cluster_status】集群组成的状态,应为"Primary", 否则说明出现脑裂现象

【wsrep_ready】应为为ON,表示当前节点可以正常提供服务;若为OFF, 则该节点可能发生脑裂或网络问题导致

【wsrep_local_state_uuid】集群中所有节点的该状态值应该是相同的,如果有不同值节点,说明其没有加入集群

【wsrep_cluster_state_uuid】与【wsrep_local_state_uuid】值一致

【wsrep_gcomm_uuid】各个节点的值不同

■ 最常使用的查看命令

show variables like 'wsrep%';

show status like 'wsrep%';

三、PXC节点的配置安装

最靠谱的参考文档,一定是官方文档

https://www.percona.com/doc/percona-xtradb-cluster/8.0/index.html

各类网文水平参差不齐,错误百出,仅供参考

四、PXC节点的上线与下线

■ 查看节点的服务状态

systemctl status mysql

systemctl status mysql@bootstrap

根据以上命令可以确认哪个节点是集群启动的首节点

■ PXC节点的安全下线

节点是怎么启动的,就使用对应的命令去关闭

启动【首节点】命令:

systemctl start mysql@bootstrap

对应关闭命令:

systemctl stop mysql@bootstrap

启动【其他节点】命令:

systemctl start mysql

对应关闭命令:

systemctl stop mysql

■ 如集群中还有正常运行的节点,其他节点只需按普通节点上线即可

systemctl start mysql

■ 如所有PXC节点都是安全下线的,则在启动集群时,需先启动最后下线的节点

systemctl start mysql@bootstrap

■ 某节点能否作为首节点启动,可以通过查看 grastate.dat 文件得知

cat /mysql/pxc/data/grastate.dat

safe_to_bootstrap: 0

说明:safe_to_bootstrap 的值为 0 时不能作为首节点启动,为1时可以作为首节点启动

PXC集群中最后一个下线的节点会将 safe_to_bootstrap 的值改为1,下次启动集群时就需将该节点作为首节点启动

最后一个下线的节点数据是最新的,将其作为首节点启动,然后让其他节点与该节点进行数据同步,这样才能保证集群中的数据是最新的,否则可能导致集群中数据是某个时间点之前的旧数据

safe_to_bootstrap 为 1时,必须使用 systemctl start mysql@bootstrap 的方式启动

■ 如PXC节点都是意外退出的,且不是在同一时间退出的

PXC集群中一半以上的节点因意外宕机而无法访问时,PXC集群就会停止运行

但如果这些PXC节点是以安全下线的方式退出,则不会引发集群自动停止运行的问题,只会缩小集群的规模

只有意外下线一半以上节点时集群才会自动停止,意外下线的情况包括:

宕机、挂起、关机、重启、断电、断网等,就是没有使用相应停止命令安全下线都属意外下线

只要PXC集群中的节点不是同时意外退出的,那么当集群还剩一个节点时,该节点就会自动将grastate.dat文件中的 safe_to_bootstrap 值改为1,所以在重启集群时,也是先启动最后一个退出的节点

■ 如PXC节点都是同时意外退出的,则需要修改grastate.dat文件

当集群所有节点正常运行时,safe_to_bootstrap 值都为 0

当集群中所有节点都是在同一时间因意外情况而退出,此时所有节点的 safe_to_bootstrap 都为 0 ,因为没有一个节点来得及去修改 safe_to_bootstrap 的值。当所有节点的 safe_to_bootstrap 均为 0 时,PXC集群是无法启动的。

在这种情况下我们就只能手动选择一个节点,将 safe_to_bootstrap 修改为 1 ,然后将该节点作为首节点进行启动:

vim grastate.dat

safe_to_bootstrap: 1

systemctl start mysql@bootstrap

接着再依次正常启动其他节点:

systemctl start mysql

五、其他

关于ProxySQL与keepalive的配置与运维,此处暂不赘述。

MySQL PXC 集群运维指南的更多相关文章

  1. 集群运维ansible

    ssh免密登录 集群运维 生成秘钥,一路enter cd ~/.ssh/ ssh-keygen -t rsa 讲id_rsa.pub文件追加到授权的key文件中 cat ~/.ssh/id_rsa.p ...

  2. 阿里巴巴大规模神龙裸金属 Kubernetes 集群运维实践

    作者 | 姚捷(喽哥)阿里云容器平台集群管理高级技术专家 本文节选自<不一样的 双11 技术:阿里巴巴经济体云原生实践>一书,点击即可完成下载. 导读:值得阿里巴巴技术人骄傲的是 2019 ...

  3. MySQL PXC集群安装配置

    1.关闭防火墙 [root@node04 ~]#systemctl disable firewalld [root@node04 ~]#systemctl stop firewalld [root@n ...

  4. PB 级大规模 Elasticsearch 集群运维与调优实践

    PB 级大规模 Elasticsearch 集群运维与调优实践 https://mp.weixin.qq.com/s/PDyHT9IuRij20JBgbPTjFA | 导语 腾讯云 Elasticse ...

  5. MySQL PXC集群部署

    安装 Percona-XtraDB-Cluster 架构: 三个节点: pxc_node_0 30.0.0.196 pxc_node_1 30.0.0.198 pxc_node_2 30.0.0.19 ...

  6. docker中mysql pxc集群

    PXC集群 https://hub.docker.com/r/percona/percona-xtradb-cluster 安装PXC镜像 下载镜像或者导入本地镜像 docker pull perco ...

  7. 使用Chef管理windows集群 | 运维自动化工具

    但凡服务器上了一定规模(百台以上),普通的ssh登录管理的模式就越来越举步维艰.试想Linux发布了一个高危漏洞的补丁,你要把手下成百上千台机器都更新该补丁,如果没有一种自动化方式,那么至少要耗上大半 ...

  8. 灵雀云:etcd 集群运维实践

    [编者的话]etcd 是 Kubernetes 集群的数据核心,最严重的情况是,当 etcd 出问题彻底无法恢复的时候,解决问题的办法可能只有重新搭建一个环境.因此围绕 etcd 相关的运维知识就比较 ...

  9. etcd 集群运维实践

    etcd 是 Kubernetes 集群的数据核心,最严重的情况是,当 etcd 出问题彻底无法恢复的时候,解决问题的办法可能只有重新搭建一个环境.因此围绕 etcd 相关的运维知识就比较重要,etc ...

  10. PB级大规模Elasticsearch集群运维与调优实践

    导语 | 腾讯云Elasticsearch 被广泛应用于日志实时分析.结构化数据分析.全文检索等场景中,本文将以情景植入的方式,向大家介绍与腾讯云客户合作过程中遇到的各种典型问题,以及相应的解决思路与 ...

随机推荐

  1. 解决redis从服务器未配置主服务器密码导致数据未同步&磁盘饱满问题

    问题前置场景 本人前几天买了一台2核4G+40G磁盘空间的云服务器用来学习使用,在服务器上安装了docker.为了学习redis主从架构,使用docker-compose部署了一主二从三台redis服 ...

  2. 企业级logstash简单使用(ELK)

    企业级logstash简单使用(ELK) 要使用logstash收集到Elasticsearch的方式,需确保logstash版本与es版本一致. 由于我也是刚刚研究使用,所以本文暂不会出现原理性的东 ...

  3. Python 引用问题 - ImportError: attempted relative import with no known parent package

    问题描述 近日在尝试引用其他文件的代码时,遇到了错误: ImportError: attempted relative import with no known parent package. 问题大 ...

  4. python笔记:第二章基本数据类型

    基本数据类型 Python中的数据类型可以分为五大类:字符串.数字.容器.布尔.None 1.字符串 可以使用单引号或双引号创建字符串,可以用加号将两个字符串合并 name = '小明' age = ...

  5. 将mongodb注册成windows(win10)的服务

    首先参考这个大佬的文章: 下载mongodb 然后解压 为了方便路径,我改了个名字MongoDB, 然后把它拖到了c盘的Program Files文件夹中 这样他的路径就是 (这个路径在很多地方都要用 ...

  6. ASP.NET Core - 日志记录系统(一)

    一.日志记录 日志记录是什么?简单而言,就是通过一些方式记录应用程序运行中的某一时刻的状态,保留应用程序当时的信息.这对于我们进行应用程序的分析.审计以及维护有很大的作用. 作为程序员,我们恐怕谁也不 ...

  7. Mysql生成测试数据函数

    1.查看设置是否允许创建函数系统参数 show variables like 'log_bin_trust_function_creators'; 2.临时设置允许创建函数系统参数 set globa ...

  8. QPushButton按钮的使用

    1 import sys 2 from PyQt5.QtCore import * 3 from PyQt5.QtGui import * 4 from PyQt5.QtWidgets import ...

  9. 干了这么多年C#,后悔没早点用这种“分页”,简单/高效/易维护

    [前言] 干了这么多年C#,后悔没早点用这种"分页",简单/高效/易维护,比其它的分页方式强多了,不信你自己看. [正文] 支持.Net Core(2.0及以上)与.Net Fra ...

  10. Kafka入门学习

    什么是 Kafka Kafka 是由 Linkedin 公司开发的,它是一个分布式的,支持多分区.多副本,基于 Zookeeper 的分布式消息流平台,它同时也是一款开源的基于发布订阅模式的消息引擎系 ...