14:25分左右,某数据库主副本服务器崩溃报错,
在数据库无法接收SQL语句进行调整的情况下重启了主副本服务器。

由于服务器重启时间会比较长,为了保证主副本服务器重启期间数据库能正常进行写入,强制将主库切换到辅助服务器。并通知连接字符串中不能自动切换的部分应用的数据库直接配置到新的主副本服务器。

而由于咱们AlwaysOn的同步模式是异步模式,原本应该承担只读路由的新只读辅助副本无法同步新主副本的数据,意味着AlwaysOn配置失效,进而导致使用只读数据库连接的大部分应用不可用。

整个AlwasyOn必须重新搭建(主库备份->拷贝->从库还原->日志还原->加入AlwaysOn)。在这期间由于急着恢复AlwaysOn,没能想到应用无法连接只读从库的快速解决方案。(先临时让修改连接字符串配置)
重新搭建过程中遇到一个坑,AlwaysOnGroup中稍大的库在加入AlwaysOn之前还原日志备份时总是报错,在脑子不太好使的情况下重试了好几次后才想起来是新的主库上配置有日志定期备份的作业(在主要节点模式时自动生效)导致日志链断裂。

15:45分左右,终于脑子灵光点,重新配置AlwasyOn只读路由,使得只读连接和读写连接全部指向主副本服务器,至此,外部影响终于消灭。

17:20分左右,新的AlwaysOn搭建完成,并使用同步模式重新切换回原来的主副本服务器,数据库恢复原状。

相关脚本:

如果新的辅助副本无法承担只读连接,修改新主副本的只读路由:

ALTER AVAILABILITY GROUP [AG-01]
MODIFY REPLICA ON N'SQL2' WITH (PRIMARY_ROLE(READ_ONLY_ROUTING_LIST = (N'SQL2',N'SQL1'))) --新主副本SQL2的只读路由为先SQL2,即不路由到辅助副本。(修改前顺序应该是(N'SQL1',N'SQL2'))
ALTER AVAILABILITY GROUP [AG-01]
MODIFY REPLICA ON N'SQL1' WITH (SECONDARY_ROLE(ALLOW_CONNECTIONS = NO)) --关闭原主库的只读连接
GO

重搭AlwaysOn时,还原完整备份,日志备份后将DB1加入AG-01

ALTER DATABASE Db1 SET HADR AVAILABILITY GROUP = [AG-01];

经验教训:

1.如果AlwaysOn AG是异步模式,在设置只读路由时,第一辅助副本的路由应该优先指向自己,而非别的副本。因为异步模式下切换后,整个AG就只剩下新的主副本那一个孤家寡人了,路由指向其它副本只是一厢情愿。

2.如果是同步模式,当然第一辅助副本的只读路由优先指向别的可用副本。(切换后也能读写分离)

本文链接:http://www.cnblogs.com/ajiangg/p/6398858.html

一次失败的生产系统中AlwaysOn AG切换经历的更多相关文章

  1. SAP系统中ASCS、ERS、PAS、AAS

    SAP系统中ASCS.ERS.PAS.AAS是什么: ASCS:ABAP Central services instance (Message server) PAS: Primary applica ...

  2. 用户管理 之 Linux 系统中的超级权限的控制

    在Linux操作系统中,root的权限是最高的,也被称为超级权限的拥有者.普通用户无法执行的操作,root用户都能完成,所以也被称之为超级管理用户. 在系统中,每个文件.目录和进程,都归属于某一个用户 ...

  3. Java生鲜电商平台-生鲜系统中微服务架构设计与分析实战

    Java生鲜电商平台-生鲜系统中微服务架构设计与分析实战 说明: Java生鲜系统中微服务的拆分应该如何架构设计与分析呢?以下是我的实战中的设计与经验分析. 目录 1. 微服务简介2. 当前现状3. ...

  4. 用adb pull命令从android系统中读取文件失败的原因及解决办法

    问题:使用adb pull命令从android系统中读取文件失败.显示:Permission denied   原因:是由于文件权限原因引起.       使用ls -l命令查看android系统中的 ...

  5. MES系统在小批量电子行业生产管理中的应用

    小批量电子产品生产管理的主要问题 电子电器制造类企业,既有单件小批量生产,也有批量生产:有按库存生产,也有按订单生产,属于典型的离散制造行业.因产品的不同其生产工艺流程也不尽相同,生产设备的布置不是按 ...

  6. tomcat在win10系统中安装失败的问题,修改tomcat内存

    自己以前在其他系统上安装tomcat服务都没有问题,但是在win10系统上安装就经常出现问题,自己总结了一下安装步骤: 1.首先需要配置环境变量, CATALINA_HOME 2.修改service. ...

  7. 企业生产环境中linux系统分区的几种方案

    方案1:针对网站集群架构中的某个节点服务器分区 该服务器上的数据有多份(其他节点也有)且数据不太重要,建议分区方案如下: /boot: 200MB swap: 物理内存的1.5倍,当内存大于或等于8G ...

  8. 生产环境中,数据库升级维护的最佳解决方案flyway

    官网:https://flywaydb.org/ 转载:http://casheen.iteye.com/blog/1749916 1.  引言 想到要管理数据库的版本,是在实际产品中遇到问题后想到的 ...

  9. Liu Junqiao:生产环境中shell脚本实例

    在生产环境中,我们时常要注意主机的各种硬件状态,如果是规模较大的服务集群zabbix等健康工具当然好用,如果只是一些小规模的服务主机,shell就会表现的更灵活,也更适用,今天就和大家分享一个系统巡检 ...

随机推荐

  1. 选择 Python3.6 还是 Python 3.7

    转自:白月黑羽在线教程:http://www.python3.vip/doc/blog/python/home/ 选择 Python3.6 还是 Python 3.7 Python 3.7 已经发布了 ...

  2. CRM项目测试第一天

    经过前几天代码的修改,界面的完善.主要的功能都实现了!今天主要是交换各组的项目,互相来测试,找bug. 在互相测试的过程,我听见有一组应该算是讨论的比价激烈的!我们组我们自己找到了bug,但是测试我们 ...

  3. Font Awesome(一套很棒的图标库)

    Font Awesome 是一个非常方便的图标库.这些图标都是矢量图形,被保存在 .svg 的文件格式中.这些图标就和字体一样,你可以通过像素单位指定它们的大小,它们将会继承其父HTML元素的字体大小 ...

  4. 并发编程之 CyclicBarrier 源码分析

    前言 在之前的介绍 CountDownLatch 的文章中,CountDown 可以实现多个线程协调,在所有指定线程完成后,主线程才执行任务. 但是,CountDownLatch 有个缺陷,这点 JD ...

  5. [转]webpack4.0.1安装问题和webpack.config.js的配置变化

    本文转自:https://blog.csdn.net/jiang7701037/article/details/79403637 The CLI moved into a separate packa ...

  6. ASP.NET开发,从二层至三层,至面向对象

    昨天Insus.NET有写了一篇博文<WEB控件没有什么所谓好不好,而是用得好不好>http://www.cnblogs.com/insus/p/3821644.html  很多网友持意见 ...

  7. Linq 处理 List数据

    概述:LINQ又称为语言集成查询,是一种类似于SQL的一种查询语言.语言集成查询让开发人员可以使用.NET程序语言(如C#)去查询数据源,主要数据源为内存中的集合对象.ADO.NET数据集.数据库以及 ...

  8. SQL:多表联合更新

    update 表一 set 表一.列1 = 表二.列1 from 表一,表二 where 表一.列2 = 表二.列2

  9. winform窗体 小程序【三级联动】

    三级联动[省,市,区] 类似地区选择,当选的某个省份,后面的下拉框相对变成对应省份的区县 实现省市区联动关键是数据库的表,[每个省内区的AreaCode列是同样的] public Form2() { ...

  10. 【模板】堆优化 + dij +pair 存储

    就是短 感谢Cptraserdalao的博客 #include<bits/stdc++.h> using namespace std; struct node { int val,num; ...