Snapshot
agent读取article的信息,将article的内容和脚本放置到snapshot文件夹中; 接下来distribution
agent会读取这些快照文件,传输到订阅,完成初始化操作。期间distribution
agent需要处理很多事情,例如判断快照是否可用,需要应用那些快照文件,传输过程中发生中断怎么办 等等。这些都需要distribution
agent来协调。读完本文之后您会对这些处理方式有所了解,也会帮助您更好地判断当前事务复制的状态以及进行错误排查。

 
 

在此之前,我要先简单地介绍一下distribution
agent的工作方式:

Distribution
agent包含两个进程,reader和writer。 Reader负责从distribution 数据库中读取数据,Writer负责将reader读取的数据写入到订阅数据库.

reader是通过sp_MSget_repl_commands来读取distribution数据库中(读取Msrepl_transactions表和Msrepl_Commands表)的数据

下面是sp_MSget_repl_commands的参数定义

CREATE
PROCEDURE
sys.sp_MSget_repl_commands 

@agent_id int, 

@last_xact_seqno varbinary(16), 

@get_count tinyint
= 0,  -- 0 = no count, 1 = cmd and tran (legacy), 2 = cmd only 

@compatibility_level int
= 7000000, 

@subdb_version int
= 0, 

@read_query_size int
=
-1 

这个存储过程有6个参数,在Transactional
replication 中,只会使用前4个(并且第三个参数和第四个参数的值是固定不变的.分别为0和10000000)。下面是一个例子:

exec
sp_MSget_repl_commands 46,0x0010630F000002A900EA00000000,0,10000000

 
 

@agent_id表示distribution
agent
id,每个订阅都会有一个单独的distribution
agent来处理数据。 带入@agent_id后,就可以找到订阅对应的publication 和所有的article。

@last_xact_seqno 表示上一次传递到订阅的LSN。

大致逻辑是:Reader读取分发数据库中LSN大于@last_xact_seqno的数据。 Writer将读取到的数据写入订阅,并更新订阅的LSN.( MSreplication_subscriptions表的 transaction_timestamp列)。然后Reader会继续用新的LSN来读取后续的数据,再传递给Writer,如此往复。在sp_MSget_repl_commands 的处理过程中, Msrepl_Commands表(通过type列进行区分)的数据大致分为两种: 1快照产生的数据,2 正常更新产生的数据

 
 

现在基本知识介绍完毕,下面开始进入正题

 
 

 
 

如何判断快照是否可用

 
 

Distribution
agent 会使用存储过程sp_MSsubscription_status(exec sp_MSsubscription_status @agendId)去判断当前快照的状态:

  1. 当创建发布和订阅后,distribution 数据库中MSsubscriptions表的status列为1(Subscribed),
  2. 如果此时运行distribution
    agent,会抛出21075, 21076或21088错误"The initial snapshot for %%  is not yet available".  
  3. 当快照生成后,snapshot
    agent会去更新MSsubscriptions中的status列的状态。当status列的值为2(Actived)时,表示快照已经完成,这样distribution agent就可以正常运行了。不过根据不同的设置,snapshot
    agent会将status列更新为不同的值:
  4. 如果sync_method是concurrent(sql server 2005以及以后版本的默认模式),status的值会变更为3; 如果此时运行distribution agent,会出现下面的21388的错误The concurrent snapshot for publication 'PublicationName' is not available because it has not been fully generated or the Log Reader Agent is not running to activate it. If generation of the concurrent snapshot was interrupted, the Snapshot Agent for the publication. 我们必须运行一下log reader
    agent,运行后, status就被更新为2(active)了. 这样distribution agent就可以正常运行了。
  5. 如果sync_method是native,那么status的值会被直接更新为2,

     
     

    如何应用快照文件

    Snapshot会在快照文件夹或alt_snapshot_folder生成快照文件,那么distribution agent是如何找到这些文件并应用的呢?

    Snapshot agent会将一些信息写入到distribution 数据库中的MSrepl_transactions和MSrepl_commands表中,下面是snapshot产生后两张表的查询截图

    那么这些内容代表什么意义呢?我们可以通过sp_browsereplcmds来查看 ,

    use
    distribution

    go

    exec
    sp_browsereplcmds
    '0x0000001E0000008F001E','0x0000001E0000008F001E' .

    表中的内容包含了snapshot文件的名称和路径, distribution agent就会据这些信息将snapshot应用到订阅数据库中。

     
     

     
     

    如何判断是否需要应用快照

    当一个订阅数据库完成初始化之后,如何避免distribuiton agent下次运行时重复应用快照呢?
    系统表中并没有单独的字段来标记订阅数据库是否已经完成了快照。
    实际上,这些判断逻辑是包含在sp_MSget_repl_commands里的:

    当第一次初始化时,订阅数据库的LSN(MSreplication_subscriptions表的 transaction_timestamp)小于快照文件对应的LSN,这样,所有大于订阅LSN(也包含了快照)的数据都会被同步到订阅。

     
     

    接下来就有个问题了,假设发布添加了一个新的订阅数据库,新的订阅数据库需要distribution agent来帮助其完成初始化快照的步骤。于是生成了一个新的快照,这些快照的xact_seqn肯定是大于已存在的订阅的xact_seqno的。 但对于已经存在的订阅数据库,是不需要应用这些快照的.那么distribution agent是如何处理这种情况的呢?

    实际上sp_MSget_repl_commands除了会比较xact_seqno,还存在额外的判断:订阅对应的每个已发布项目在 MSsubscriptions 表中都会有一行记录。MSsubscriptions 表的subscription_seqno 列表示快照事务序列号;publisher_seqno  列表示该订阅在发布服务器上的事务序列号。如果@last_xact_seqno的值小于这两个值中的任意一个,就表示订阅需要应用快照,否则表示快照已经应用过了,只需要应用后续更新即可。

    当第一次快照生成后,这两个列的值就不会再放生变化了(除非订阅被标记为需要重新初始化),但是订阅数据库的MSreplication_subscriptions表的 transaction_timestamp是不断增加的,所以即使生成新的快照,已存在的订阅也不会受到影响。

     
     

    在应用快照过程中意外中断怎么办?

    假设一共有8个snapshot文件,distribution
    agent已经应用了3个文件,在应用第四个文件的时候OS重启了。 那重启后该如何继续呢? 是否需要全部重新开始呢? 答案是否定的。 在应用snapshot文件的过程中,distribution
    agent会向subscription数据库里的MSsnapshotdeliveryprogress系统表写入数据,每当一个文件成功应用到订阅,就会写入一条数据。如果意外重启,distribution
    agent会根据这张表来判断哪些文件已经被应用过。当所有的snapshot文件都传递到订阅后,distribution会清除表里的内容。  当下面是MSsnapshotdeliveryprogress的查询截图。

事务复制中的snapshot的更多相关文章

  1. 事务复制中的msrepl_ccs

    在事务复制里,如果一个article被更新,distributionagent会调用相应的存储过程将数据更新到订阅端. 这些存储过程分别是[sp_MSins_dboTableName],[sp_MSd ...

  2. 解决服务器复制中SID冲突问题

    解决服务器复制中SID冲突问题 如果你有多部的主机需要安装,最快的方法是什么?想必就是用像GHOST之类的软件来进行硬盘的复制.当然,如果是安装在虚拟机之中,则需要复制虚拟的硬盘档案即可,以微软的VP ...

  3. MySQL主从复制中replicate-ignore-db replicate-wild-ignore-table的应用

    MySQL主从复制中replicate-ignore-db replicate-wild-ignore-table的应用 replicate-ignore-dbreplicate-wild-ignor ...

  4. Spring 下默认事务机制中@Transactional 无效的原因

    Spring中 @Transactional 注解的限制1. 同一个类中, 一个nan-transactional的方法去调用transactional的方法, 事务会失效 If you use (d ...

  5. 复制中的NOT FOR REPLICATION

    错误#1 10:51 2012-9-4sp_MSget_repl_commands 重复键插入解答#1 修改distribution库下sp_MSget_repl_commands 存储过程decla ...

  6. MySQL复制中slave延迟监控

    在MySQL复制环境中,我们通常只根据 Seconds_Behind_Master 的值来判断SLAVE的延迟.这么做大部分情况下尚可接受,但并不够准确,而应该考虑更多因素. 首先,我们先看下SLAV ...

  7. 关于MySQL主从复制中UUID的警告信息

    日期: 2014年5月23日 博客: 铁锚 最近在查看MariaDB主从复制服务器 Master 的错误日志时看到很多条警告信息,都是提示 UUID()函数不安全,可能 Slave 产生的值和 Mas ...

  8. 事务复制5: Transaction and Command

    事务复制使用 dbo.msrepl_transactions 和 dbo.MSrepl_commands 存储用于数据同步的Transaction和Command.在replication中,每个co ...

  9. SQLServer复制(二)--事务代理作业

    之前的一篇已经介绍了如何配置复制,介绍了发布者.分发者和订阅者以及事务日志运行的简单关系.其中提到了复制代理,我们这篇将详细介绍复制代理,它是什么?在事务复制的步骤中起到了什么作用? 代理和工作 首先 ...

随机推荐

  1. JAVA学习中Swing部分JDialog对话框窗体的简单学习

    package com.swing; import java.awt.Color;import java.awt.Container;import java.awt.event.ActionEvent ...

  2. CreateJSのTweenJS、SoundJS、PreloadJS

    TweenJS基础实例: var canvas = document.getElementById('myCanvas'), stage = new createjs.Stage(canvas); v ...

  3. Mule ESB 社区版 企业版 资源下载 包含3.5和3.6

    很多的资源官方已经没有提供下载了,我将资源上传到网盘,供大家下载和收藏 AnypointStudio-for-win-32bit-5.0.2-201502251307.ziphttp://pan.ba ...

  4. Visual Studio 2013 and .NET 4.6

    I'm trying to set the 4.6 .NET framework for my project and in the settings, as it wasn't listed, I ...

  5. #入魔这些年#零度智控&模型控社区大型征文活动,万元大奖等你拿

        玩航模是个好爱好,它能培养严谨的科学态度.超强的DIY动手能力.规范的项目管理习惯.良好的沟通合作技巧.过人的三维空间思维和感知: 你需要的知识储备有力学.空气动力学.电子学.通讯工程.材料学 ...

  6. c/c++ 输入输出缓冲区

    关于缓冲区的详细介绍,请参考 C++编程对缓冲区的理解 CPP的输入输出流和缓冲区 c++输出缓冲区刷新   (1)c++中cin.cout,cerr和c的stdin.stdout.stderr都是同 ...

  7. DataTable 排序

    DataTable newdtb = new DataTable(); newdtb.Columns.Add("Id", typeof(int)); newdtb.Columns. ...

  8. Asp.net Core 1.0.1升级到Asp.net Core 1.1.0 Preview版本发布到Windows Server2008 R2 IIS中的各种坑

    Asp.net Core 1.0.1升级到Asp.net Core 1.1.0后,程序无法运行了 解决方案:在project.json中加入runtime节点 "runtimes" ...

  9. cocos2d-x-3.0 的改变,由于变得太多,一点点累积吧!

    1.cpp  改成  Point 2.setIsRelativeAnchorPoint() 改成  ignoreAnchorPointForPosition() 3.Layer::create   图 ...

  10. Spring3系列4-多个配置文件的整合

    Spring3系列4-多个配置文件的整合 在大型的Spring3项目中,所有的Bean配置在一个配置文件中不易管理,也不利于团队开发,通常在开发过程中,我们会按照功能模块的不同,或者开发人员的不同,将 ...