前文

  • 假定您对Azure和SQL Server HA具有基础知识
  • 假定您对Azure Cli具有基础知识
  • 目标是在Azure Linux VM上创建一个具有三个副本的可用性组,并实现侦听器和Fencing配置

环境

  • SQL Server 2019 Developer on Linux
  • Azure VM Fencing agent
  • Azure Cli实现部分配置
  • CentOS 7.7 Azure VM,分别SQL19N1,SQL19N2,SQL19N3,位于同一VNet

步骤

  • 为VM创建资源组和可用性集

  1. # 中国东部2创建资源组
  2. az group create --name SQL-DEMO-RG --location chinaeast2
  3. # 创建用于VM的Availability Set,配置2个容错域,2个更新域
  4. az vm availability-set create \
  5. --resource-group SQL-DEMO-RG \
  6. --name AGLinux-AvailabilitySet \
  7. --platform-fault-domain-count 2 \
  8. --platform-update-domain-count 2
  • 使用Template部署3台VM

第一次创建VM时,会生成template,然后下载保存下,修改其中的参数值后,就可以方便地创建配置类似的VM。VM的配置主要有:

  • 使用前面的可用性集
  • 使用同一个子网
  • IP使用Standard
  • SSH public key配置

模板和参数文件太长,就不展示了。可以在Azure Portal上自行获取。

  1. # 如下是SQL19N2的配置,修改参数文件后,直接可以用于创建SQL19N3
  2. templateFile="./templateFile"
  3. paramFile="./vmParams-sql19n2.json"
  4. az deployment group validate --name sql19n2vm \
  5. -g SQL-DEMO-RG --template-file $templateFile --parameters $paramFile
  • 配置VM使用固定内网IP和公网DNS Label

三台VM都需要修改配置,如下只是一台的配置示例

  1. # 找出nic和IP的信息
  2. az network nic list -g SQL-DEMO-RG --query "[].{nicName:name,configuration:ipConfigurations[].{ipName:name,ip:privateIpAddress,method:privateIpAllocationMethod}}" -o yaml
  3. # 修改privateIpAllocationMethod为Static
  4. az network nic ip-config update -g SQL-DEMO-RG --nic-name sql19n1152 --name ipconfig1 --set privateIpAllocationMethod=Static
  5. # 找出pbulic ip名称
  6. az network public-ip list -g SQL-DEMO-RG --query "[].name" -o tsv
  7. # 配置Public IP的DNS name,只能使用数字和小写字母
  8. az network public-ip update -g SQL-DEMO-RG -n SQL19N1ip851 --dns-name sql19n1
  • 安装HA相关软件包

最好先更新一下系统的软件包,再安装HA相关软件。

  1. yum update -y
  2. yum install -y pacemaker pcs fence-agents-all resource-agents fence-agents-azure-arm
  3. reboot
  • 为群集和SQL Server开放防火墙端口

  1. # Pacemaker和Corosync的端口
  2. # TCP: Ports 2224,3121,21064,5405
  3. # UDP: Port 5405
  4. firewall-cmd --add-port=2224/tcp --permanent
  5. firewall-cmd --add-port=2224/tcp --permanent
  6. firewall-cmd --add-port=21064/tcp --permanent
  7. firewall-cmd --add-port=5405/tcp --permanent
  8. firewall-cmd --add-port=5405/udp --permanent
  9. # SQL Server端口和AG镜像端口
  10. # TCP: 1433,5022
  11. firewall-cmd --add-port=1433/tcp --permanent
  12. firewall-cmd --add-port=5022/tcp --permanent
  13. firewall-cmd --reload
  • 添加hosts记录

  1. vi /etc/hosts
  2. 172.17.2.8 SQL19N1
  3. 172.17.2.9 SQL19N2
  4. 172.17.2.10 SQL19N3
  • 创建Pacemaker群集

  1. # 设置Pacemaker的默认用户密码,三台VM上
  2. passwd hacluster
  3. # 设置pacemaker和pcsd自启动在三台VM上
  4. systemctl enable pcsd
  5. systemctl start pcsd
  6. systemctl enable pacemaker
  7. # 创建群集,在master节点
  8. sudo pcs cluster auth SQL19N1 SQL19N2 SQL19N3 -u hacluster
  9. sudo pcs cluster setup --name agcluster SQL19N1 SQL19N2 SQL19N3 --token 30000 --force
  10. sudo pcs cluster start --all
  11. sudo pcs cluster enable --all
  12. # 查看群集状态
  13. pcs status
  14. # 在三个节点上修改quorum的expected-votes为3,其实三节点群集默认为3
  15. # 设置表示,群集存活需要3票,这个修改只影响当前running的群集,不会变成群集的永久性配置保存下来
  16. pcs quorum expected-votes 3
  • 在Azure上为Fencing Agent配置Service Principal

  1. # 1. 创建 AAD App,成功后记录下相应的appID
  2. az ad app create --display-name sqldemorg-app --identifier-uris http://localhost \
  3. --password "1qaz@WSX3edc" --end-date '2030-04-27' --credential-description "sql19 ag secret"
  4. # 2. 创建AAD App的Service Principal
  5. az ad sp create --id <appID>
  6. # 3. 将Service Principal分配到VM对应的管理role,对每个VM都要执行
  7. # 我这里分配的是Owner role,这不是安全的做法。应该使用自定义一个role,只给最小权限
  8. # 自定义role需要Azure订阅是PP1或者PP2级别
  9. az role assignment create --assignee <appID> --role owner \
  10. --scope /subscriptions/<subscription-ID>/resourceGroups/<resourceGroup-Name>/providers/Microsoft.Compute/virtualMachines/SQL19N1
  • 创建Azure的STONITH 设备

我使用的是Azure China,所以需要指定cloud=china,如果使用global Azure不需要指定此参数。

执行 fence_azure_arm -h,查看此资源代理的更多帮助信息

  1. pcs property set stonith-timeout=900
  2. pcs stonith create rsc_st_azure fence_azure_arm login="<ApplicationID>" passwd="<servicePrincipalPassword>" resourceGroup="<resourceGroupName>" tenantId="<tenantID>" subscriptionId="<subscriptionId>" power_timeout=240 pcmk_reboot_timeout=900 cloud=china
  • 安装SQL 2019及工具

  1. # 安装 SQL 2019和HA 资源代理
  2. sudo curl -o /etc/yum.repos.d/mssql-server.repo https://packages.microsoft.com/config/rhel/7/mssql-server-2019.repo
  3. sudo yum install -y mssql-server
  4. sudo /opt/mssql/bin/mssql-conf setup
  5. sudo yum install mssql-server-ha
  6. # 安装 mssql-tools
  7. sudo curl -o /etc/yum.repos.d/msprod.repo https://packages.microsoft.com/config/rhel/7/prod.repo
  8. sudo yum install -y mssql-tools unixODBC-devel
  9. # 将mssql-tools目录加入到aPATH,方便使用
  10. echo 'export PATH="$PATH:/opt/mssql-tools/bin"' >> ~/.bash_profile
  11. echo 'export PATH="$PATH:/opt/mssql-tools/bin"' >> ~/.bashrc
  12. source ~/.bashrc
  13. # 安装 mssql-cli
  14. sudo rpm --import https://packages.microsoft.com/keys/microsoft.asc
  15. sudo curl -o /etc/yum.repos.d/mssql-cli.repo https://packages.microsoft.com/config/rhel/7/prod.repo
  16. sudo yum install mssql-cli
  17. # 查看SQL 状态
  18. systemctl status mssql-server

如果您熟悉 SQL Server相关的PowerShell,建议将PowerShell也安装上,并安装SQLServer module。对SQL Server的配置,使用PowerShell会方便很多

  1. yum install powershell -y
  2. pwsh
  3. Install-Module SQLServer
  4. # 查看SQL相关的命令
  5. Get-Command -Module SQLServer
  • 配置AG

  • 创建PowerShell 函数方便后续执行T-SQL
  1. # 打开PowerShell的 profile文件,如果不存在则需要创建
  2. vi /root/.config/powershell/Microsoft.PowerShell_profile.ps1
  3. # 将如下函数加入 到 profile文件中,每次打开pwsh时就可以直接调用
  4. # 函数有两个参数,$sql表示需要执行的T-SQL,最好使用here-string以避免字符转义问题
  5. # $servers表示目标实例,数组类型。默认值为当前环境中的三个实例
  6. function run-sql ($sql,$servers=("SQL19N1","SQL19N2","SQL19N3"))
  7. {
  8. $secpasswd = "1qaz@WSX"|ConvertTo-SecureString -AsPlainText -Force
  9. $cred=New-Object System.Management.Automation.PSCredential -ArgumentList 'sa', $secpasswd
  10. $sql
  11. "---------"
  12. foreach($svr in $servers) {"Running T-SQL on $svr..."; Invoke-Sqlcmd -ServerInstance $svr -Credential $cred -Query $sql}
  13. }

  • 启用 hadr功能,每个实例
  1. sudo /opt/mssql/bin/mssql-conf set hadr.hadrenabled 1
  2. sudo systemctl restart mssql-server
  • 启动AG extened event session
  1. # T-SQL,每个实例
  2. ALTER EVENT SESSION AlwaysOn_health ON SERVER WITH (STARTUP_STATE=ON);
  3. GO
  • 在主副本实例上创建证书,这个证书用于验证Mirroring endpoint通信。将证书和私钥复制到其它节点上的相同的目录位置。授予mssql用户访问权限
  1. CREATE MASTER KEY ENCRYPTION BY PASSWORD = '1qaz@WSX';
  2. GO
  3. CREATE CERTIFICATE dbm_certificate WITH SUBJECT = 'dbm';
  4. GO
  5. BACKUP CERTIFICATE dbm_certificate
  6. TO FILE = '/var/opt/mssql/data/dbm_certificate.cer'
  7. WITH PRIVATE KEY (
  8. FILE = '/var/opt/mssql/data/dbm_certificate.pvk',
  9. ENCRYPTION BY PASSWORD = '1qaz@WSX'
  10. );
  1. # 复制证书和私钥到辅助副本主机SQL19N2和SQL19N3
  2. cd /var/opt/mssql/data
  3. scp dbm_certificate.* root@SQL19N2:/var/opt/mssql/data/
  4. scp dbm_certificate.* root@SQL19N3:/var/opt/mssql/data/
  5. # 辅助副本节点上修改权限
  6. cd /var/opt/mssql/data
  7. chown mssql:mssql dbm_certificate.*
  • 在辅助副本实例中创建master key并导入证书
  1. CREATE MASTER KEY ENCRYPTION BY PASSWORD = '1qaz@WSX';
  2. GO
  3. CREATE CERTIFICATE dbm_certificate
  4. FROM FILE = '/var/opt/mssql/data/dbm_certificate.cer'
  5. WITH PRIVATE KEY (
  6. FILE = '/var/opt/mssql/data/dbm_certificate.pvk',
  7. DECRYPTION BY PASSWORD = '1qaz@WSX'
  8. );
  • 创建AG的镜像端口,注意防火墙和NSG配置端口例外
  1. CREATE ENDPOINT [Hadr_endpoint]
  2. AS TCP (LISTENER_PORT = 5022)
  3. FOR DATABASE_MIRRORING (
  4. ROLE = ALL,
  5. AUTHENTICATION = CERTIFICATE dbm_certificate,
  6. ENCRYPTION = REQUIRED ALGORITHM AES
  7. );
  8. GO
  9. ALTER ENDPOINT [Hadr_endpoint] STATE = STARTED;
  • 创建三个副本,同步模式的AG,主副本实例上执行
  1. CREATE AVAILABILITY GROUP [ag1]
  2. WITH (DB_FAILOVER = ON, CLUSTER_TYPE = EXTERNAL)
  3. FOR REPLICA ON
  4. N'SQL19N1'
  5. WITH (
  6. ENDPOINT_URL = N'tcp://SQL19N1:5022',
  7. AVAILABILITY_MODE = SYNCHRONOUS_COMMIT,
  8. FAILOVER_MODE = EXTERNAL,
  9. SEEDING_MODE = AUTOMATIC,
  10. SECONDARY_ROLE(ALLOW_CONNECTIONS = ALL)
  11. ),
  12. N'SQL19N2'
  13. WITH (
  14. ENDPOINT_URL = N'tcp://SQL19N2:5022',
  15. AVAILABILITY_MODE = SYNCHRONOUS_COMMIT,
  16. FAILOVER_MODE = EXTERNAL,
  17. SEEDING_MODE = AUTOMATIC,
  18. SECONDARY_ROLE(ALLOW_CONNECTIONS = ALL)
  19. ),
  20. N'SQL19N3'
  21. WITH(
  22. ENDPOINT_URL = N'tcp://SQL19N3:5022',
  23. AVAILABILITY_MODE = SYNCHRONOUS_COMMIT,
  24. FAILOVER_MODE = EXTERNAL,
  25. SEEDING_MODE = AUTOMATIC,
  26. SECONDARY_ROLE(ALLOW_CONNECTIONS = ALL)
  27. );
  28. GO
  29. ALTER AVAILABILITY GROUP [ag1] GRANT CREATE ANY DATABASE;
  30. GO
  • 为Pacemaker创建sql登录并授权,每个实例
  1. USE [master]
  2. GO
  3. CREATE LOGIN [pacemakerLogin] with PASSWORD= N'1qaz@WSX'
  4. go
  5. ALTER SERVER ROLE [sysadmin] ADD MEMBER [pacemakerLogin];
  6. GO
  • 将pacemaker的login信息保存到本地文件
  1. echo "pacemakerLogin" >> /var/opt/mssql/secrets/passwd
  2. echo "1qaz@WSX" >> /var/opt/mssql/secrets/passwd
  3. # 只允许root读取
  4. chown root:root /var/opt/mssql/secrets/passwd
  5. chmod 400 /var/opt/mssql/secrets/passwd
  • 将辅助副本加入到AG, 辅助副本执行
  1. ALTER AVAILABILITY GROUP [ag1] JOIN WITH (CLUSTER_TYPE = EXTERNAL);
  2. GO
  3. # auto_seeding功能需要的权限
  4. ALTER AVAILABILITY GROUP [ag1] GRANT CREATE ANY DATABASE;
  5. GO
  • 如果您不希望pacemakerLogin具有sysadmin的权限,可以将之从sysadmin中移除,并授予如下权限。每个实例
  1. ALTER SERVER ROLE [sysadmin] DROP MEMBER [pacemakerLogin]
  2. GO
  3. GRANT ALTER, CONTROL, VIEW DEFINITION ON AVAILABILITY GROUP::ag1 TO pacemakerLogin;
  4. GO
  5. GRANT VIEW SERVER STATE TO pacemakerLogin;
  6. GO
  • 添加数据库到AG,主副本执行
  1. CREATE DATABASE [db1];
  2. GO
  3. ALTER DATABASE [db1] SET RECOVERY FULL;
  4. GO
  5. BACKUP DATABASE [db1]
  6. TO DISK = N'nul';
  7. GO
  8. ALTER AVAILABILITY GROUP [ag1] ADD DATABASE [db1];
  9. GO
  • 可用性数据库状态
  1. SELECT * FROM sys.databases WHERE name = 'db1';
  2. GO
  3. SELECT DB_NAME(database_id) AS 'database', synchronization_state_desc FROM sys.dm_hadr_database_replica_states;
  • 在Pacemaker群集中配置AG


  • 创建AG资源,ag_name要指定为之前创建AG名称
  1. pcs resource create agcluster ocf:mssql:ag ag_name=ag1 meta failure-timeout=30s master notify=true
  • 创建虚拟IP资源
  1. # 禁用fencing
  2. pcs property set stonith-enabled=false
  3. # 创建VIP
  4. pcs resource create virtualip ocf:heartbeat:IPaddr2 ip=172.17.2.7
  • 创建 colacation constraint,vip和master必需在同一个节点上启动
  1. pcs constraint colocation add virtualip agcluster-master INFINITY with-rsc-role=Master
  • 创建 ordering constraint,vip要先于master副本资源启动
  1. pcs constraint order promote agcluster-master then start virtualip
  2. # 查看当前的约束
  3. pcs constraint show --full
  • 重新启用STONITH并查看群集状态
  1. pcs property set stonith-enabled=true
  2. pcs status
  3. # 我的环境中的状态信息
  4. ---------------------------------------
  5. Cluster name: agcluster
  6. Stack: corosync
  7. Current DC: SQL19N3 (version 1.1.20-5.el7_7.2-3c4c782f70) - partition with quorum
  8. Last updated: Wed Apr 29 04:24:50 2020
  9. Last change: Wed Apr 29 04:24:45 2020 by root via cibadmin on SQL19N1
  10. 3 nodes configured
  11. 5 resources configured
  12. Online: [ SQL19N1 SQL19N2 SQL19N3 ]
  13. Full list of resources:
  14. rsc_st_azure (stonith:fence_azure_arm): Started SQL19N1
  15. Master/Slave Set: agcluster-master [agcluster]
  16. Masters: [ SQL19N1 ]
  17. Slaves: [ SQL19N2 SQL19N3 ]
  18. virtualip (ocf::heartbeat:IPaddr2): Started SQL19N1
  19. Daemon Status:
  20. corosync: active/enabled
  21. pacemaker: active/enabled
  22. pcsd: active/enabled
  • 测试Failover和Fencing
  1. # 手动failover
  2. pcs resource move agcluster-master SQL19N2 --master
  3. pcs status
  4. # 手动 failover会生成一个constraint,避免AG资源再回到原来的节点
  5. # 如果希望AG后续还能 failover回来,需要手动删除之
  6. pcs constraint show --full
  7. pcs constraint remove cli-prefer-agcluster-master
  8. # 尝试Fencing群集节点,每个节点都试一下
  9. # 如下命令的fencing只是重启node,如果要关闭node,使用--off参数
  10. pcs stonith fence SQL19N3 --debug

在 Azure CentOS VM 中配置 SQL Server 2019 AG - (上)的更多相关文章

  1. 在Spring中配置SQL server 2000

    前言 Lz主要目的是在Spring中配置SQL server 2000数据库,但实现目的的过程中参差着许多SQL server 2000的知识,也包罗在本文记载下来!(Lz为什么要去搞sql serv ...

  2. 配置sql server 2000以允许远程访问 及 连接中的四个最常见错误

    地址:http://www.cnblogs.com/JoshuaDreaming/archive/2010/12/01/1893242.html 配置sql server 2000以允许远程访问适合故 ...

  3. Linux 上配置 SQL Server Always On Availability Group

    SQL Server Always On Availability Group 配置步骤:配置三台 Linux 集群节点创建 Availability Group配置 Cluster Resource ...

  4. 配置SQL Server去使用 Windows的 Large-Page/Huge-Page allocations

    配置SQL Server去使用 Windows的 Large-Page/Huge-Page  allocations 目录表->页表->物理内存页 看这篇文章之前可以先看一下下面这篇文章 ...

  5. 宣布正式发布 Windows Azure Notification Hub,新增 SQL Server AlwaysOn 可用性组侦听器支持

    今天,我们非常高兴地宣布,针对使用 Windows Azure 的移动和企业开发人员推出一些新功能.这些新功能可以减少构建移动应用程序的开发时间和成本,并能帮助企业开发人员实现高可用性和全球业务连续性 ...

  6. 配置SQL Server on Linux(1)

    1. 背景 SQL Server一般是在安装过程中进行相关的配置,安装完成之后,再去修改有一些配置就比较麻烦,比如更改SQL Server实例级别的排序规则.但在Linux下,安装过程并没有很多可以配 ...

  7. 配置SQL Server on Linux(2)

    1. 前言 前一篇配置SQL Server on Linux(1),地址:http://www.cnblogs.com/fishparadise/p/8125203.html ,是关于更改数据库排序规 ...

  8. 在Windows Server 2012 R2中搭建SQL Server 2012故障转移集群

    需要说明的是我们搭建的SQL Server故障转移集群(SQL Server Failover Cluster)是可用性集群,而不是负载均衡集群,其目的是为了保证服务的连续性和可用性,而不是为了提高服 ...

  9. 配置SQL Server 2005 远程连接(转)

    方法如下:  一.为 SQL Server 2005 启用远程连接1. 单击"开始",依次选择"程序"."Microsoft SQL Server 2 ...

随机推荐

  1. Nginx是什么东东?

    Nginx的产生 没有听过Nginx?那么一定听过它的"同行"Apache吧!Nginx同Apache一样都是一种WEB服务器.基于REST架构风格,以统一资源描述符(Unifor ...

  2. python字典(dict)

    1.字典dict定义 初始化 key-value键值对的数据的集合,可变.无序.key不重复(哈希.唯一) 1> d = dict() 或者 d = {} # -*- coding:utf-8 ...

  3. [noip模拟]心<并查集>

    背景描述: 不是一切深渊都是灭亡 不是一切灭亡都覆盖在弱者的头上 ——<这也是一切> 舒婷 有N个透明的盒子, 每个盒子里面有两个不同颜色的球, 总共有M种颜色. Alice和Bob又在玩 ...

  4. CSS3实现3D转换

    实现效果: 当鼠标悬停在图片上面时,图片发生翻转,文案出来,鼠标取消之后就又恢复 实现代码: <!DOCTYPE html> <html lang="en"> ...

  5. Js闭包练习2020031801

    <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/stri ...

  6. Flutter 完美的验证码输入框

    老孟导读:刚开始看到这个功能的时候一定觉得so easy,开始的时候我也是这么觉得的,这还不简单,然而真正写的时候才发现并没有想象的那么简单. 先上图,不上图你们都不想看,我难啊,到Github:ht ...

  7. P1004 方格取数(四维dp)

    P1004 方格取数 思路如下 这题是看洛谷大佬的思路才写出来的,所以我会把大佬的思路展示如下: 1⃣️:我们可以找到一个叫思维dp的东西,dp[i][j][k][l],其中前两维表示一个人从原点出发 ...

  8. vue 刮刮乐功能实现

    <template> <!--游玩区域--> <div class="panel"> <canvas id="canvas&qu ...

  9. 十年测试老鸟告诉你--自动化测试选JAVA还是选Python--写给还在迷茫中的朋友

    一.前言 Python和Java哪个更适合做自动化测试?这是很多测试工程师从功能跨入自动化纠结的问题,今天测试老鸟来带大家详细分析一下!写给还在迷茫中的朋友! 首先可以确认的是提出这个问题的肯定是一个 ...

  10. CH5501 环路运输(单调栈)

    传送门 思路: 遇到一个环,用正常人类的思想就先把环从中间截断然后将其补成2*n长度的链.环上的最小距离换到链上就是i以n/2为半径范围内的点(画图肉眼可见).由于两个点是等价的,所以我们考虑有序对( ...