目的:在已经加域的计算机上安装sqlserver2012,并配置系统级故障转移及数据库,实现AlwayOn. 域控的建立详见:https://www.cnblogs.com/xiaoerlang90/p/9224745.html 计算机加域:https://www.cnblogs.com/xiaoerlang90/p/9234805.html 域控: 名称:dcTest.com IP: 192.168.31.20 用户名:sql_admin 密码:dcTest2018 操作系统:windows…
1- jmp为无条件转移指令,可以只修改IP, 也可以同时修改CS和IP jmp指令要给出两种信息: (1) 转移的目的地址 (2) 转移的距离(段间转移, 段内转移, 段内近转移) 2- 依据位移进行转移的jmp指令 jmp short 标号(转到表号处执行指令) ;段内短转移 -128-127 assume cs:codesg codesg segment jmp short s s:inc ax codesg ends end start 执行后 ax 0001H 2- 根据位移进行转移的…
线上 S1 故障是什么 线上 S1 故障, 运维故障分级, 运维, 故障分级, P1 级别故障, 故障, P1 , S1 故障复盘 https://time.geekbang.org/column/article/1064 编程 S1 故障分级 https://kknews.cc/zh-cn/code/3qv3ry3.html 运维故障分级 运维必备制度:故障分级和处罚规范 https://yq.aliyun.com/articles/199040 故障分级标准 P1 级别故障 http://w…
一.故障诊断 查看messages日志c0d0t0这块盘不断报错,类型为:retryable,如下: root@gdhx # more /var/adm/messages Aug  5 16:43:03 gdhx scsi: [ID 107833 kern.warning] WARNING: /pci@0,600000/pci@0/pci@8/pci@0/scsi@1/sd@1,0 (sd0): Aug  5 16:43:03 gdhx    Error for Command: write(1…
具体测试环境请参考: AlwaysOn可用性组测试环境安装与配置(一)--SQL群集环境搭建 AlwaysOn可用性组测试环境安装与配置(二)--AlwaysOn配置(界面与T-SQL) 一. AlwaysOn可用性组故障转移测试 1. 自动故障转移 1.1 将故障转移模式改成自动,如果实例为SQL Server故障转移实例则配置无效. 1.2 在SERVER03自动转移,CLUSTEST03\CLUSTEST03手动转移的情况下,kill SERVER03的SQL Server服务.如下界面…
资源组是由一个或多个资源组成的组,WSFC的故障转移是以资源组为单位的,资源组中的资源是相互依赖的.一个资源所依赖的其他资源必须和该资源处于同一个资源组,跨资源组的依赖关系是不存在的.在任何时刻,每个资源组都仅属于集群中的一个结点,该结点就是资源组的活跃结点(Active Node),由活跃结点为应用程序提供服务.AlwaysOn建立在WSFC的健康检测和故障转移的特性之上,和故障转移集群有了不可分割的关系,因此,从底层的集群资源来理解可用性组,知其然知,其所以然,有助于更好地维护AlwaysO…
本篇文章主要介绍Windows2012的故障转移集群一个新功能“动态仲裁”,默认该功能是开启的: 动态仲裁能在当前群集投票出现分歧的情况下取消某些节点的投票权限,比如偶数个节点的群集环境.仲裁见证和动态仲裁有点相似也可以解决群集投票分歧的问题,但是它不能取消节点的投票权,它能保持群集的投票个数保持奇数个数. SQLServer版本: SQL Server 2016 SP1 Windows版本:Windows Server 2012 DataCenter 群集节点:HD21DB03,HD21DB0…
WSFC 群集 (WSFC cluster)“Windows Server 故障转移群集”(WSFC) 群集是一组独立的服务器,它们共同协作以提高应用程序和服务的可用性. 故障转移群集实例 (Failover cluster instance)一个 Windows 服务实例,用于管理 IP 地址资源.网络名称资源和运行一个或多个应用程序或服务所需的其他资源. 客户端可以使用网络名称访问组中的资源,类似于使用计算机名称访问物理服务器上的服务. 但是,因为故障转移群集实例是一个组,所以该实例可以故障…
一 WSFC 简介 1.1 WSFC 概述 “Windows Server 故障转移群集”(WSFC) 群集是一组独立的服务器,它们共同协作以提高应用程序和服务的可用性.SQL Server 2012 利用 WSFC 服务和功能支持 AlwaysOn 可用性组和 SQL Server 故障转移群集实例. Windows Server 故障转移群集提供了各种基础结构功能来支持所承载的服务器应用程序(如 Microsoft SQL Server 和 Microsoft Exchange)的高可用性和…
和终端用户相比,企业用户对于业务的连续性和可靠性更为在意.相对而言,企业一般不会将追逐单一硬件的性能排在第一位. 如何衡量业务是否持续可用,一般使用"x 个 9"这种方式来定义.如我们常说的"3 个 9",即表示年可用性为 99.9%,也即意味着一年只能有 8.76 个小时的系统停机时间.对于单台物理服务器而言,这意味着该设备一年内不能出现硬件损坏的情况,否则更换配件和重新上架的时间过长,很容易导致可用性等级超出这个标准. 像"5 个 9",甚至…
转载:http://dufei.blog.51cto.com/382644/902026 今天有客户问起Windows 群集的相关内容,毕竟Windows Server2008所支持的群集技术和Windows Server2003还是有点不同的,就收集了以下知识供参考.以下内容均来自互联网. Windows Server 2008提供两种群集技术:故障转移群集和网络负责平衡群集.故障转移群集主要提供高可用性:网络负载平衡群集主要提供可伸缩性,在实现可伸缩性的同时,提高基于WEB服务的可用性.有的…
和终端用户相比,企业用户对于业务的连续性和可靠性更为在意.相对而言,企业一般不会将追逐单一硬件的性能排在第一位. 如何衡量业务是否持续可用,一般使用"x 个 9"这种方式来定义.如我们常说的"3 个 9",即表示年可用性为 99.9%,也即意味着一年只能有 8.76 个小时的系统停机时间.对于单台物理服务器而言,这意味着该设备一年内不能出现硬件损坏的情况,否则更换配件和重新上架的时间过长,很容易导致可用性等级超出这个标准. 像"5 个 9",甚至…
#故障转移 Failover #当其中一个节点关闭宕机时,其节点中的service会转移到另一个节点上.Swarm会检测到node1发生故障并把此故障节点的状态标记为Down; docker node ls 可查看 node1的STATUS 为Down同时 Swarm会把node1上的service调度到其它有资源的节点上来运行:docker service ps web_server 可查看其过程和状态 #访问server #便于分析,重新部署一个 docker service create…
故障转移群集(Failover Cluster)可以提供一个高可用性应用程序或服务的网络环境,本章将接受如何搭建iSCSI SAN文件服务器故障转移群集. 故障转移群集概述 我们可以将多台服务器组成一个故障转移群集,这些服务器会协同工作以提高一个高可用性的应用程序或群集内每台服务器被称为一个节点(Node),节点之间通过网络硬件与软件连接在一起对用户提供服务,这个过程被称为故障转移,它让用户能够不中断的继续享有服务器提供的服务. 天太热,其他不高兴写,写一些注意事项,然后再把实验过程写一下. 群…
上一章我们配置了一台设备,接着根据那个配置,配置其它设备.这里我配置了三台设备: 创建故障转移群集,并添加设备. 之前的操作都是每台服务器都要做的,而这个操作,只需要任选一台去做即可,我这里选d1 1. 在这打开"故障转移群集管理器" 2. 点创建群集 3. 输入三个服务器域名,点"添加" 等待验证结束后,点下一步即可 4. 跳过验证 然后会有个验证,这个验证可以跳过.当然你也可以验证试试... 5.配置群集名称和IP IP在第一章的表格里提到过 后面一路点下一步与…
上一篇最后提到了mandatory这个参数,对于设置mandatory参数个人感觉还是很重要的,尤其在RabbitMQ镜像队列发生故障转移时. 模拟个测试环境如下: 首先在集群队列中增加两个镜像队列的策略: 对于ha-promote-on-shutdown这个参数,可以参考文档,其作用就是当集群中master出现故障时强制进行故障转移从而选出新的master节点,这里的master出现故障表示的是人为的故障比如通过命令行rabbitmqctl.bat start_app之类的关闭RabbitMQ…
(1)复制集集群的数据同步 1>主节点数据库test,在其中goods集合中加入一个文档. 2>在副节点中查看 注意:SECONDARY是不允许读写的,要使用rs.slaveOk()获得读写权限 (2)故障转移 1>故障1:副节点宕机 关闭副节点MongoDB实例后 2.在主节点观察复制集集群状态 3.在主节点student数据库中score集合中再插入一条记录 4.然后在主节点观察复制集集群状态(用rs.status()) 5.重启副节点MongoDB实例 6.在主节点观察复制集集群状…
上下文 您已经决定在设计或修改基础结构层时使用群集以提供高度可用的服务. 问题 您应该如何设计一个高度可用的基础结构层,来防止因单台服务器或它所运行的软件出现故障而导致的服务丢失? 影响因素 在设计高度可用的基础结构层时,请考虑下列影响因素: 硬件组件.应用程序或服务出现故障可以使应用程序无法使用或不可用. 例如,设想一台正在提供应用程序的服务器出现了电源故障. 如果这是唯一的服务器或服务器中的唯一电源,则存在故障单点,并且应用程序将不可用. 计划内的服务器停机时间可以影响应用程序的可用性. 例…
下面是我们在使用AlwaysOn过程中遇到的一个切换案例.这个案例发生在2014年8月,虽然时间相对久远了,但是对我们学习理解AlwaysOn的FailOver原理和过程还是很有帮助的.本次FailOver的触发原因是系统I/O问题.大家需要理解,操作系统I/O出现了问题不一定立即触发SQL Server发生漂移,因为坏的槽点可能不在SQL Server实例所用到的位置,但是随着时间持续 和数据堆积,问题槽点可能扩大升级.我们可以看到在本例中,第一次出现I/O问题到SQL Server 漂移间隔…
目前公司有一套核心交易数据库配置了AlWaysON,SQL 2012版本, 1主4从, 其从库(8,14, 8.15) 这2台只读的从数据库服务器, 后台程序和wms等很多程序,都是直接配置IP连接这个2个机器,而且这2台机器已经过保,如果其中一天机器出现故障,不能使用,怎么处理?         怎么解决? 先谈谈后果: 这2台机器都有很多程序只读查询操作,一旦一台挂了,起不来(虽然概率很低), 连故障服务器的程序,IP要改,同时程序要重启, 这些程序和服务,还很多,很容易漏.一旦出现故障,至…
一 AlwaysOn 可用性组 1.1 AlwaysOn 可用性组概述 AlwaysOn 可用性组功能是一个提供替代数据库镜像的企业级方案的高可用性和灾难恢复解决方案.SQL Server 2012 中引入了 AlwaysOn 可用性组功能,此功能可最大程度地提高一组用户数据库对企业的可用性. “可用性组”针对一组离散的用户数据库(称为“可用性数据库”,它们共同实现故障转移)支持故障转移环境. 一个可用性组支持一组读写主数据库以及一至四组对应的辅助数据库.可使辅助数据库能进行只读访问和/或某些备…
最近由于数据库hang住,无奈之下直接干掉了pmon进程,再次启动的时候收到了ORA-01092: ORACLE instance terminated. Disconnection forced以及ORA-12432: LBAC error: zllegnp:OCIStmtExecute.这下好了,有的整了,是个从来没有遇见的错误.下面是对这个错误的描述与解决. 1.故障描述idle> startupORACLE instance started. Total System Global Ar…
elastic-job中最关键的特性之一就是失效转移.配置了失效转移之后,如果在任务执行过程中有一个执行实例挂了,那么之前被分配到这个实例的任务(或者分片)会在下次任务执行之前被重新分配到其他正常节点实例上执行. 简单的HA 当某一个任务实例节点宕机(离开与zookeeper的连接),会触发elastic-job主节点的重新分片逻辑.elastic-job启动任务节点以后生成的zookeeper中的instance节点是一个临时节点EPHEMERAL.为什么要用EPHEMERAL节点,就是为了能…
1.先决条件 DGMGRL> ENABLE FAST_START FAILOVER; Error: ORA-: requirements not met for enabling fast-start failover [oracle@vijay02 ~]$ oerr ora , , "requirements not met for enabling fast-start failover" // *Cause: The attempt to enable fast-start…
目录 文章目录 目录 Health Manager 监控 amphora 健康状态 故障转移 故障迁移测试 Health Manager Health Manager - This subcomponent monitors individual amphorae to ensure they are up and running, and otherwise healthy. It also handles failover events if amphorae fail unexpected…
更多操作参考:https://www.cnblogs.com/gered/p/9435282.html [生产问题]-dbcc checkdb报错-数据页故障 数据页故障,索引页故障 use db_tank dbcc checkdb--报错如下由index ID 3可以得知,其为非聚集索引页出了问题 Msg , , State , Line , , partition ID , alloc unit ID (type :) :). Possible chain linkage problem.…
非常非常抱歉!2016年3月7日15:44-16:39,由于阿里云RDS(云数据库)故障,造成全站不能正常访问,给您带来了很大很大的麻烦,恳请您的谅解! 故障是在15:44开始出现的,应用日志中出现大量这样的错误: System.Data.SqlClient.SqlException (0x80131904): Logon failed for login '...' due to trigger execution. 当前命令发生了严重错误.应放弃任何可能产生的结果. 在 System.Dat…
故障review的一些总结 故障review的目的 归纳出现故障产生的原因 检查故障的产生是否具有普遍性,并尽可能的保证同类问题不在出现, 回顾故障的处理流程,并检查处理过程中所存在的问题.并确定此类问题的处理方法论.使得即便以后出现了同类的问题,也有明确的方法论来指导 标明后续改进措施及落实时间点 经验总结和分享 故障的级别定义 不同公司对于故障的级别有不同的定义,一般会有P1,P2,P3这几类故障,故障的严重级别依次降低.一个可能的定义如下: P1 公司主站提供的服务出现异常,广告展示出现问…
1.SFC中包的格式 网络服务包头,当Obit被设置为1时,表示一个SFC OAM消息 OAM Type:SFC OAM的类型(1.连接认证,2.持续性检验,3.路由跟踪,4.性能度量) SFC OAM的有效负载描述如下: Version:SFC OAM消息的版本,总共8bit,当前的版本是0x01 Message Type:SFC OAM消息类型(1持续性检验,2跟踪请求消息,3跟踪响应消息) Originator Handle:消息原始发送端 Remote Handle:终端,通常用来验证部…
主板故障中因为BIOS/COMS设置不当或者因为主板电池引起的coms故障而导致主板无法正常工作的比例占了不小.今天我们就来说说主板BIOS/COMS的故障和解决.声卡维修 硬盘安装设置 CMOS设置在更换电池不久后便无法保存笔记本故障 故障现象:一台奔腾4 2.4GHz电脑,搭配了华硕865PE芯片组的主板.使用三年多没有出现任何问题.最近开机后发现时钟无法保存,进入CMOS重新设置时间后,再次断电开机会,时钟仍然归零.于是,认为主板的电池用尽,重新换电池后,使用不到一个月再次出现此故障. 故…