KingbaseES V8R6集群运维案例之---同一主机节点部署多个集群

案例说明：

在同一主机环境，由于生产需要，需要部署两个集群；本案例详细描述了两个集群的部署过程。

注意：同一主机部署多个集群需要先部署securecmdd服务，节点之间通过securecmdd服务通讯。多个集群共享主机的securecmdd服务在节点之间通讯。

适用版本：

KingbaseES V8R6

一、检测主机节点securecmdd服务

1、查看securecmdd服务及端口

[kingbase@node101 bin]$ ps -ef |grep securecmd

root     15486     1  0 14:34 ?        00:00:00 sys_securecmdd: /home/kingbase/cluster/securecmdd/bin/sys_securecmdd -f /etc/.kes/securecmdd_config [listener] 0 of 128-256 startups

[kingbase@node101 bin]$ netstat -antlp|grep 8890

(Not all processes could be identified, non-owned process info

 will not be shown, you would have to be root to see it all.)

tcp        0      0 0.0.0.0:8890            0.0.0.0:*               LISTEN      -

tcp6       0      0 :::8890                 :::*                    LISTEN      -

2、测试securecmd连接（所有节点）

# 本机

[kingbase@node101 bin]$ ./sys_securecmd kingbase@127.0.0.1 'whoami'

kingbase

[kingbase@node101 bin]$ ./sys_securecmd root@127.0.0.1 'whoami'

root

# 远程

[kingbase@node101 bin]$ ./sys_securecmd kingbase@192.168.1.102 'whoami'

kingbase

[kingbase@node101 bin]$ ./sys_securecmd root@192.168.1.102 'whoami'

root

二、第一个集群部署

1、集群部署（参考官方文档，可以采用部署工具或脚本部署）

https://help.kingbase.com.cn/v8/install-updata/k-deploy/index.html

2、查看第一个集群节点状态

[kingbase@node101 bin]$ ./repmgr cluster show

 ID | Name  | Role    | Status    | Upstream | Location | Priority | Timeline | LSN_Lag | Connection string

----+-------+---------+-----------+----------+----------+----------+----------+---------+---------------------------------------------------------------------------------------------------------------------------------------------------

 1  | node1 | primary | * running |          | default  | 100      | 6        |         | host=192.168.1.101 user=esrep dbname=esrep port=54321 connect_timeout=10 keepalives=1 keepalives_idle=10 keepalives_interval=1 keepalives_count=3

 2  | node2 | standby |   running | node1    | default  | 100      | 6        | 0 bytes | host=192.168.1.102 user=esrep dbname=esrep port=54321 connect_timeout=10 keepalives=1 keepalives_idle=10 keepalives_interval=1 keepalives_count=3

3、第一个集群配置

[kingbase@node101 bin]$ cat ../etc/repmgr.conf

use_scmd=on

ha_running_mode='DG'

node_id=1

node_name='node1'

conninfo='host=192.168.1.101 user=esrep dbname=esrep port=54321 connect_timeout=10 keepalives=1 keepalives_idle=10 keepalives_interval=1 keepalives_count=3'

connection_check_type='mix'

data_directory='/data/kingbase/hac7/data'

#data_directory='/home/kingbase/cluster/R6HA/ha7/kingbase/data'

log_file='/home/kingbase/cluster/R6HA/ha7/kingbase/kingbase/log/hamgr.log'

kbha_log_file='/home/kingbase/cluster/R6HA/ha7/kingbase/kingbase/log/kbha.log'

sys_bindir='/home/kingbase/cluster/R6HA/ha7/kingbase/kingbase/bin'

scmd_options='-q -o ConnectTimeout=10 -o StrictHostKeyChecking=no -o ServerAliveInterval=2 -o ServerAliveCountMax=5 -p 8890'

trusted_servers='192.168.1.1'

running_under_failure_trusted_servers='on'

repmgrd_pid_file='/home/kingbase/cluster/R6HA/ha7/kingbase/kingbase/etc/hamgrd.pid'

kbha_pid_file='/home/kingbase/cluster/R6HA/ha7/kingbase/kingbase/etc/kbha.pid'

......

三、第二个集群部署（脚本部署）

1、脚本部署所需文件

[kingbase@node102 r6_install]$ ls -l

total 234236

-rw-rw-r-- 1 kingbase kingbase 237558136 Apr  7 14:07 db.zip

-rw-rw-r-- 1 kingbase kingbase     12397 Apr 19 16:09 install.conf

-rw-r--r-- 1 kingbase kingbase      3454 Apr  7 14:08 license.dat

-rw-rw-r-- 1 kingbase kingbase   2114981 Apr 19 15:43 securecmdd.zip

-rw-rw-r-- 1 kingbase kingbase      3902 Apr  7 14:07 trust_cluster.sh

-rw-rw-r-- 1 kingbase kingbase    152215 Apr  7 14:07 V8R6_cluster_install.sh

2、创建集群部署目录（两个集群分别在不同目录下）

[kingbase@node102 r6_install]$  mkdir -p /home/kingbase/cluster/R6HA/hac7/kingbase/

3、配置部署配置文件

[kingbase@node102 r6_install]$ cat install.conf|grep -v ^$|grep -v ^#

[install]

on_bmj=0

all_ip=(192.168.1.102 192.168.1.101)

witness_ip=""

production_ip=()

local_disaster_recovery_ip=()

remote_disaster_recovery_ip=()

install_dir="/home/kingbase/cluster/R6HA/hac7"

zip_package="/home/kingbase/r6_install/db.zip"

license_file=(license.dat)

db_user="system"                 # the user name of database

db_port="54325"                  # the port of database, defaults is 54321

db_mode="oracle"                 # database mode: pg, oracle

db_auth="scram-sha-256"          # database authority: scram-sha-256, md5, default is scram-sha-256

db_case_sensitive="no"          # database case sensitive settings: yes, no. default is yes - case sensitive; no - case insensitive (NOTE. cannot set to 'no' when db_mode="pg").

db_checksums="yes"               # the checksum for data: yes, no. default is yes - a checksum is calculated for each data block to prevent corruption; no - nothing to do.

archive_mode="on"                # enables archiving; off, on, or always

db_encoding=""                   # Cararcter set encoding to use in the new database.Specify a tring constant,or an integer encoding number, default value provided by locale command.

db_collate=""                    # Collation order(LC_COLLATE) to use in the new database,This affects the sort order applied to strings, default value provided by locale command.

db_ctype=""                      # Character classification(LC_CTYPE) to use int the new database. This affects the categorization of characters, default value provided by locale command.

other_db_init_options=""         # addional initdb options,such as "--scenario-tuning"

trusted_servers="192.168.1.1"

running_under_failure_trusted_servers='on'

data_directory="/home/kingbase/cluster/R6HA/hac7/kingbase/data"

waldir=''

virtual_ip=""

net_device=(enp0s3 enp0s3)

net_device_ip=(192.168.1.102 192.168.1.101)

ipaddr_path="/sbin"

arping_path=""

ping_path="/bin"

super_user="root"

execute_user="kingbase"

deploy_by_sshd=0               # choose whether to use sshd when deploy, 0 means not to use (deploy by sys_securecmdd), 1 means to use (deploy by sshd), default value is 1; when on_bmj=1, it will auto set to no(deploy_by_sshd=0)

use_scmd=1                     # Is the cluster running on sys_securecmdd or sshd? 1 means yes (on sys_securecmdd), 0 means no (on sshd), default value is 1; when on_bmj=1, it will auto set to yes(use_scmd=1)

reconnect_attempts="10"          # the number of retries in the event of an error

reconnect_interval="6"           # retry interval

recovery="standby"               # the way of cluster recovery: standby/automatic/manual

ssh_port="22"                    # the port of ssh, default is 22

scmd_port="8890"                 # the port of sys_securecmdd, default is 8890

auto_cluster_recovery_level='1'

use_check_disk='off'

synchronous=''

sync_in_same_location=0

failover_need_server_alive='off'

4、拷贝db.zip文件到集群安装目录下并解压（所有节点）

1）拷贝db.zip到所有节点

[kingbase@node102 r6_install]$ cp db.zip /home/kingbase/cluster/R6HA/hac7/kingbase

[kingbase@node102 r6_install]$ scp db.zip node101:/home/kingbase/cluster/R6HA/hac7/kingbase

db.zip                                                             100%  227MB  88.2MB/s   00:02

2）解压db.zip

[kingbase@node101 kingbase]$ unzip db.zip

[kingbase@node101 kingbase]$ ls -lh

total 227M

drwxr-xr-x 2 kingbase kingbase 4.0K Oct 29 14:57 bin

-rw-rw-r-- 1 kingbase kingbase 227M Apr 19 16:07 db.zip

drwxrwxr-x 5 kingbase kingbase 8.0K Oct 29 14:57 lib

drwxrwxr-x 7 kingbase kingbase 4.0K Oct 29 14:57 share

5、拷贝license.dat文件到集群bin目录下

[kingbase@node102 r6_install]$ cp license.dat /home/kingbase/cluster/R6HA/hac7/kingbase/bin/

[kingbase@node102 r6_install]$ scp license.dat node101:/home/kingbase/cluster/R6HA/hac7/kingbase/bin/

license.dat                                                        100% 3454     3.3MB/s   00:00

6、执行脚本部署

[kingbase@node102 r6_install]$ sh V8R6_cluster_install.sh

........

2023-04-19 16:14:25 repmgrd on "[192.168.1.101]" start success.

 ID | Name  | Role    | Status    | Upstream | repmgrd | PID   | Paused? | Upstream last seen

----+-------+---------+-----------+----------+---------+-------+---------+--------------------

 1  | node1 | primary | * running |          | running | 32636 | no      | n/a

 2  | node2 | standby |   running | node1    | running | 4895  | no      | 1 second(s) ago

[2023-04-19 16:14:26] [NOTICE] redirecting logging output to "/home/kingbase/cluster/R6HA/hac7/kingbase/log/kbha.log"

[2023-04-19 16:14:28] [NOTICE] redirecting logging output to "/home/kingbase/cluster/R6HA/hac7/kingbase/log/kbha.log"

2023-04-19 16:14:28 Done.

[INSTALL] start up the whole cluster ... OK

---如上所示，第二个集群部署完成。

7、第二个集群配置

[kingbase@node102 bin]$ cat ../etc/repmgr.conf

use_scmd=on

ha_running_mode='DG'

node_id=1

node_name='node1'

conninfo='host=192.168.1.102 user=esrep dbname=esrep port=54325 connect_timeout=10 keepalives=1 keepalives_idle=10 keepalives_interval=1 keepalives_count=3'

connection_check_type='mix'

data_directory='/home/kingbase/cluster/R6HA/hac7/kingbase/data'

log_file='/home/kingbase/cluster/R6HA/hac7/kingbase/log/hamgr.log'

kbha_log_file='/home/kingbase/cluster/R6HA/hac7/kingbase/log/kbha.log'

sys_bindir='/home/kingbase/cluster/R6HA/hac7/kingbase/bin'

scmd_options='-q -o ConnectTimeout=10 -o StrictHostKeyChecking=no -o ServerAliveInterval=2 -o ServerAliveCountMax=5 -p 8890'

trusted_servers='192.168.1.1'

running_under_failure_trusted_servers='on'

repmgrd_pid_file='/home/kingbase/cluster/R6HA/hac7/kingbase/etc/hamgrd.pid'

kbha_pid_file='/home/kingbase/cluster/R6HA/hac7/kingbase/etc/kbha.pid'

......

四、集群验证

1、第一个集群节点状态

[kingbase@node102 bin]$ pwd

/home/kingbase/cluster/R6HA/hac7/kingbase/bin

[kingbase@node102 bin]$ ./repmgr cluster show

 ID | Name  | Role    | Status    | Upstream | Location | Priority | Timeline | LSN_Lag | Connection string

----+-------+---------+-----------+----------+----------+----------+----------+---------+---------------------------------------------------------------------------------------------------------------------------------------------------

 1  | node1 | primary | * running |          | default  | 100      | 1        |         | host=192.168.1.102 user=esrep dbname=esrep port=54325 connect_timeout=10 keepalives=1 keepalives_idle=10 keepalives_interval=1 keepalives_count=3

 2  | node2 | standby |   running | node1    | default  | 100      | 1        | 0 bytes | host=192.168.1.101 user=esrep dbname=esrep port=54325 connect_timeout=10 keepalives=1 keepalives_idle=10 keepalives_interval=1 keepalives_count=3

2、第二个集群节点状态

[kingbase@node101 bin]$ pwd

/home/kingbase/cluster/R6HA/ha7/kingbase/kingbase/bin

[kingbase@node101 bin]$ ./repmgr cluster show

 ID | Name  | Role    | Status    | Upstream | Location | Priority | Timeline | LSN_Lag | Connection string

----+-------+---------+-----------+----------+----------+----------+----------+---------+---------------------------------------------------------------------------------------------------------------------------------------------------

 1  | node1 | primary | * running |          | default  | 100      | 6        |         | host=192.168.1.101 user=esrep dbname=esrep port=54321 connect_timeout=10 keepalives=1 keepalives_idle=10 keepalives_interval=1 keepalives_count=3

 2  | node2 | standby |   running | node1    | default  | 100      | 6        | 0 bytes | host=192.168.1.102 user=esrep dbname=esrep port=54321 connect_timeout=10 keepalives=1 keepalives_idle=10 keepalives_interval=1 keepalives_count=3

五、总结

在通过脚本部署第二个集群时，需要先创建好集群安装目录，并将db.zip文件拷贝到集群安装目录下，解压；再将license.dat文件也要拷贝到集群安装目录下，然后执行脚本部署。对于需要vip的集群环境，不同的集群配置不同的vip地址。多个集群的数据库服务同时启动，需要配置不同的数据库服务端口。

KingbaseES V8R6集群运维案例之---同一主机节点部署多个集群的更多相关文章

KingbaseES V8R6集群运维案例之---repmgr standby promote应用案例
案例说明: 在容灾环境中,跨区域部署的异地备节点不会自主提升为主节点,在主节点发生故障或者人为需要切换时需要手动执行切换操作.若主节点已经失效,希望将异地备机提升为主节点. $bin/repmgr s ...
KingbaseES V8R3集群运维案例之---主库系统down failover切换过程分析
案例说明: KingbaseES V8R3集群failover时两个cluster都会触发,但只有一个cluster会调用脚本去执行真正的切换流程,另一个有对应的打印,但不会调用脚本,只是走相关的 ...
KingbaseES V8R3集群运维案例之---用户自定义表空间管理
案例说明: KingbaseES 数据库支持用户自定义表空间的创建,并建议表空间的文件存储路径配置到数据库的data目录之外.本案例复现了,当用户自定义表空间存储路径配置到data下时,出现的故障问 ...
KingbaseES V8R3集群运维案例之---kingbase_monitor.sh启动”two master“案例
案例说明: KingbaseES V8R3集群,执行kingbase_monitor.sh启动集群,出现"two master"节点的故障,启动集群失败:通过手工sys_ctl启动 ...
KingbaseES V8R3集群运维案例之---cluster.log ERROR: md5 authentication failed
案例说明: 在KingbaseES V8R3集群的cluster.log日志中,经常会出现"ERROR: md5 authentication failed:DETAIL: password ...
PB级大规模Elasticsearch集群运维与调优实践
导语 | 腾讯云Elasticsearch 被广泛应用于日志实时分析.结构化数据分析.全文检索等场景中,本文将以情景植入的方式,向大家介绍与腾讯云客户合作过程中遇到的各种典型问题,以及相应的解决思路与 ...
PB级大规模Elasticsearch集群运维与调优实践【＞＞戳文章免费体验Elasticsearch服务30天】
[活动]Elasticsearch Service免费体验馆>> Elasticsearch Service自建迁移特惠政策>>Elasticsearch Service新用户 ...
PB 级大规模 Elasticsearch 集群运维与调优实践
PB 级大规模 Elasticsearch 集群运维与调优实践 https://mp.weixin.qq.com/s/PDyHT9IuRij20JBgbPTjFA | 导语腾讯云 Elasticse ...
集群运维ansible
ssh免密登录集群运维生成秘钥,一路enter cd ~/.ssh/ ssh-keygen -t rsa 讲id_rsa.pub文件追加到授权的key文件中 cat ~/.ssh/id_rsa.p ...
阿里巴巴大规模神龙裸金属 Kubernetes 集群运维实践
作者 | 姚捷(喽哥)阿里云容器平台集群管理高级技术专家本文节选自<不一样的双11 技术:阿里巴巴经济体云原生实践>一书,点击即可完成下载. 导读:值得阿里巴巴技术人骄傲的是 2019 ...

随机推荐

updatedb命令
updatedb命令 updatedb创建或更新locate命令使用的数据库,如果数据库已经存在,则重用其数据以避免重新读取未更改的目录,updatedb通常由cron每天运行以更新默认数据库. 语法 ...
关于动态抽样（Dynamic Sampling）
关于动态抽样(Dynamic Sampling) 原文:http://www.oracle.com/technetwork/issue-archive/2009/09-jan/o19asktom-08 ...
Maven如何打包可执行jar包
假设我有一个maven项目叫:hello-world 新建一个HelloWorld类: package com.dylan.mvnbook.helloworld; public class Hello ...
shell 定时清理一定时间内未使用的目录下文件脚本
配合crontab即可实现标题使用 bash + 脚本 + 目录 bash xx.sh /root/xx/ 脚本如下: #!/bin/bash # 将current转换为时间戳,精确到秒 CURRE ...
pyhotn3.8 apt机器基础镜像构建
FROM python:3.8.10-slim RUN sed -i 's/deb.debian.org/mirrors.tuna.tsinghua.edu.cn/g' /etc/apt/source ...
3dMax建模笔记（一）：介绍3dMax和创建第一个模型Hello world
前言三维模型,虽然淘宝上一抓一大把,但是三维开发人员最好还是具备一定基础的建模能力.本文用hello world模型描述基本的3dMax建模流程. 3dMax 3D Studio Max ...
Golang使用Gin-swagger搭建api文档
前提是安装好了go环境与vscode环境并配置过了gin 项目结构 1.先安装swaggo依赖包 //1 go get "github.com/swaggo/files" //2 ...
服务网关ZUUL过滤器
过滤器两个功能: 1.其中路由功能负责将外部请求转发到具体的微服务实例上,是实现外部访问统一入口的基础: 2.过滤器功能则负责对请求的处理过程进行预干预,是实现请求校验.服务聚合等功能的基础. 有4类 ...
【Azure 环境】当在Azure 环境中调用外部接口不通时，如何定位SSL Certificate Problem
问题描述如果在Azure VM中,发现同一个API,一台VM可以访问成功,另外一台访问失败.如何来调试并定位问题呢? 问题分析第一步,查看访问外部API不通时候出现什么错误.如果没有明确的错误消息 ...
windows下如何结束Tomcat进程
问题描述: 使用IDEA启动java中的SSM项目之后,服务正常运行.操作过程中不小心把IDEA 开发工具给关闭啦,导致tomcat没有正常停止,使用的端口8080仍然被占用.再次打开IDEA,启动 ...

KingbaseES V8R6集群运维案例之---同一主机节点部署多个集群

KingbaseES V8R6集群运维案例之---同一主机节点部署多个集群的更多相关文章

随机推荐

热门专题