对Big Table进行全表更新，导致 Replication 同步数据的过程十分缓慢

在Publisher database中更新一个big table，数据行数是3.4亿多。由于没有更新 clustered Index key，因此，只产生了3.4亿多个Update Commands 和 1个Transaction，数据量还是很大的。在 Log reader 将 Commands 插入到 distribution.dbo.MSrepl_commands 的过程中，几乎所有的Distribution Agent 都抛出 Performance Critical 的Warning，Log Reader 插入Commands的速度十分缓慢，初步预测，仅仅是将Update Commands插入到 MSrepl_commands的时间就需要12hours。为了不影响其他数据的同步，我打算将该表的Publication 和 Subscription 删除，然后手动同步数据。

Scenario1：

在Subscriber中，成功删除Subscription。链接到Publisher，在删除Publication时，SSMS 先是 NO Responding，然后报错。查看Subscriber运行的Session，发现 Distribution Agents 的 sessions 都被block。删不掉Publication的原因，估计是Log Reader 正在读取Commands，这个操作不能被异常终止。为了避免损坏其他数据，只能等待 Log Reader 将 Update commands 插入到 distribution中了。Leader只给一天的缓冲期，必须在明天解决这个问题。

Scenario2：

在Log Reader 将 Publisher的所有commands都插入到 distribution.dbo.MSrepl_commands 之后，由于在Scenario1已经将Subscription删除，Update Commands没有同步到Target table，但也没有被删除，依然存储在MSrepl_commands中。如果运行 Distribution clean up job，减少 Commands Retition的时间，肯定会影响其他数据的同步。

EXEC dbo.sp_MSdistribution_cleanup @min_distretention = 0, @max_distretention = 120

所以，必须手动从 MSrepl_commands 删除相应的commans，同时必须从 distribution.dbo.MSrepl_transactions 删除相应的Transaction。

根据 MSrepl_transactions 中的 publisher_database_id 和 entry_time，筛选出相应的 xact_seqno（Replication用于同步Commands的事务ID），根据publisher_database_id 和 xact_seqno 查看 MSrepl_commands 的中命令的数量，用以 verify 事务的 xact_seqno。

select count(0)
from distribution.dbo.MSrepl_commands with(nolock)
where xact_seqno=0x000055A8000069610001 and publisher_database_id=19

也可以使用 sp_browsereplcmds 查看 msrepl_commands 中的SQL语句，最终确定事务的 xact_seqno，根据 publisher_database_id 和 xact_seqno从 distribution 删除commands 和 transaction。

delete
from distribution.dbo.MSrepl_commands
where xact_seqno=0x000055A8000069610001 and publisher_database_id=19
 
delete
from distribution.dbo.MSrepl_transactions
where xact_seqno=0x000055A8000069610001 and publisher_database_id=19

耗时 3个小时，终于将commands 和 transaction删除，Replication 恢复正常。
Mark：在更新Big Table时，最好将 SQL Server Replication关闭，手动在Publisher 和 Subscriber中更新，在更新完成之后，再重建Replication。

对Big Table进行全表更新，导致 Replication 同步数据的过程十分缓慢的更多相关文章

对大表进行全表更新，导致 Replication 同步数据的过程十分缓慢
在Publisher database中更新一个big table,数据行数是3.4亿多.由于没有更新 clustered Index key,因此,只产生了3.4亿多个Update Commands ...
主库增加表空间导致DG同步失败
由于主库表空间不足,同事给表空间增加数据文件,第二天收到反馈说备库未同步. 1.主.备查看归档序列号,发现主.备归档正常同步. SQL>archive log list 2.在主库端查询v$ar ...
记录一次没有收集直方图优化器选择全表扫描导致CPU耗尽
场景:数据库升级第二天,操作系统CPU使用率接近100%. 查看ash报告: 再看TOP SQL 具体SQL: select count(1) as chipinCount, sum(bets) as ...
SQL 根据关联表更新主表中字段数据
今天遇到一个客户的数据更新问题,两个相关联的表,一个主表用于保存单据主要信息,一个副表用于保存单据的明细信息:现在要把主表的其中一个字段的数据更新到副表的一个字段中保存.精通的SQL语法的,当然是很简 ...
Oracle收集对表收集统计信息导致全表扫描直接路径读？
direct path read深入解析前言最近碰到一件很奇葩的事情,因为某条SQL执行缓慢,原因是走了笛卡尔(两组大数据结果集),而且笛卡尔还是NL的一个部分,要循环31M次. 很容易发现是统计 ...
表访问方式---->全表扫描（Full Table Scans, FTS）
全表扫描(Full Table Scans, FTS) 全表扫描是指Oracle在访问目标表里的数据时,会从该表所占用的第一个区(EXTENT)的第一个块(BLOCK)开始扫描,一直扫描到该表的高水位 ...
Oracle 表的访问方式(1) ---全表扫描、通过ROWID访问表
1.Oracle访问表的方式全表扫描.通过ROWID访问表.索引扫描 2.全表扫描(Full Table Scans, FTS) 为实现全表扫描,Oracle顺序地访问表中每条记录,并检查每一条记录 ...
Oracle全表扫描
优化器在形成执行计划时需要做的一个重要选择——如何从数据库查询出需要的数据.对于SQL语句存取的任何表中的任何行,可能存在许多存取路径(存取方法),通过它们可以定位和查询出需要的数据.优化器选择其中自 ...
mysql 全表扫描、全索引扫描、索引覆盖(覆盖索引)
full index scan:全索引扫描,查询时,遍历索引树来获取数据行.如果数据不是密集的会产生随机IO 在执行计划中是Type列,index full table scan:通过读物理表获取数据 ...

随机推荐

Spark性能优化-coalesce(n)
有时用Spark 运行Job 的时候,输出可能会出现一些空或者小内容.这时重新将输出的Partition 进行重新调整,可以减少RDD中Patition的数目. 两种方式: 1. coalesce(n ...
Terminology: Sandbox
In Comupter Secuity: from https://en.wikipedia.org/wiki/Sandbox_(computer_security) In computer secu ...
DataTable转换为JSON数组
最后的格式为:[{},{},...] StringBuilder DataTableToJSON(DataTable dt) { string columnName; StringBuilder bu ...
UBUNTU 16.04 编译 OPENJDK8
参考了几篇文章,和错误查询,最后总结如下一.下载我比较倾向于使用mercurial来获取源代码,虽然你得挑网络稳定的时候更新,但是易更新. 从官网查找一下,可以通过以下步骤完成源代码的下载 1. ...
SweetAlert-js超酷消息警告框插件
简要教程 SweetAlert是一款神奇的javascript弹出消息警告框插件. 来通过一张gif图片看看SweetAlert的效果: 使用方法要使用该插件,首先要在html的header中引入以 ...
安装Python算法库
安装Python算法库主要包括用NumPy和SciPy来处理数据,用Matplotlib来实现数据可视化.为了适应处理大规模数据的需求,python在此基础上开发了Scikit-Learn机器学习算 ...
Python 爬虫3——第一个爬虫脚本的创建
在进行真正的爬虫工程创建之前,我们先要明确我们所要操作的对象是什么?完成所有操作之后要获取到的数据或信息是什么? 首先是第一个问题:操作对象,爬虫全称是网络爬虫,顾名思义,它所操作的对象当然就是网页, ...
Android带边框表格的实现
最近做项目需要用到表格,数据是动态指定的,本来用GridView是很方便的,可是老大不同意用这么重量级的控件,想办法吧. 做表格很容易想到用TableLayout,那就自定义一个来搞. 一.表格最蛋疼 ...
java-PreparedStatement的用法
转自:http://www.cnblogs.com/raymond19840709/archive/2008/05/12/1192948.html PreparedStatement的用法 jdbc( ...
vscode过滤pyc文件
在工作区设置里添加如下代码: { "files.exclude": { "**/.git": true, "**/.svn": true, ...

对Big Table进行全表更新，导致 Replication 同步数据的过程十分缓慢

对Big Table进行全表更新，导致 Replication 同步数据的过程十分缓慢的更多相关文章

随机推荐

热门专题