最近改文章,期刊要求提供所有修改内容都标红的修订稿,本着能不手改就不手改的原则,我尝试检索了一下自动修改的方法,最先找到的是简书上的一篇使用VB宏命令批量修改的文章 (Word-接受全部修订为标红字体),但是尝试之后发现运行时间很长,且有些修订不会生效,然后就开始了我的漫长研究之路。

研究过程

因为最熟悉Python,首先想到的是Python操作Word文档,主要尝试了一下三个模块,但是最后都失败了。

python-docx模块

该模块是目前Python操作Word文档最主流的模块,然而查阅资料后发现该模块目前尚不支持操作修订,只能尝试通过xml获取修订文本,通过Find选择对应本文并修改颜色。由于太过复杂,放弃。

aspose-words模块

Google到了该模块操作Word修订的sample,尝试使用后该模块确实能够实现该功能。奈何这是一个付费模块,保存的文档有水印,且只能保存9页。去水印和全文档保存则需要付费或30天试用,无奈放弃。

win32com模块

该方式也就是通过.Net提供的com文件,直接调用Word原生的API处理文档。参考多方资料后,能勉强实现修订标红功能,代码如下:

# 引入模块
import win32com.client as win32
import win32com
from tqdm import tqdm
# 设置参数
path_file_input = r"input.doc"
path_file_output = r"output.doc" # 创建word应用并打开文档
word=win32com.client.DispatchEx("Word.Application")
word=win32.gencache.EnsureDispatch("Word.Application")
word.Visible = False
word.DisplayAlerts = False
doc = word.Documents.Open(path_file_input)
# 激活文档并关闭修订功能
doc.Activate()
word.ActiveDocument.TrackRevisions = False
num_true=0 # 用于计算成功修改的修订数目
try:
# 迭代所有的修订
for i in tqdm(range(word.ActiveDocument.Revisions.Count)): # word.ActiveDocument.Revisions.Count 获取修订的数量
# 尝试修改当前修订
try:
# 获取当前修订
revision=word.ActiveDocument.Revisions.Item(i)
# 设置修订字体颜色
revision.Range.Font.Color=255
# 接受修订
revision.Accept()
num_true+=1
# 捕获异常。该模块在使用 word.ActiveDocument.Revisions.Item(i) 获取某一修订时,如果这一修订时删除的修订,就会抛出 集合所要求的成员不存在 错误,因此需要进行异常捕获
except Exception as e:
pass
# 另存修改后的文档
doc.SaveAs(path_file_output)
except Exception as e:
print(e)
# 保证文档和应用句柄释放
finally:
# # 关闭 word 文档
doc.Close()
# # 关闭 office
word.Quit()
del doc,word
# 打印成功处理的修订数量
print('num_true',num_true)

然而,实践发现,以上代码在处理到有图篇插入和分节符插入等相关的修订时,后面的所有修订都不会再处理。如果要使用该代码,需要首先在文档中手动将这些部分接受修订,使得该代码实用性不高,放弃……

最终成果

尝试了一圈Python效果都不好,最后幡然醒悟,微软的文档还是得用微软自己的东西,再次把VBA捡起来。参考VBA帮助文档中对修订的操作,最后成品代码如下:

Sub Set_Revisions_Red()
'关闭修订模式
ActiveDocument.TrackRevisions = Flase '迭代每一个修订,改为红色并接受修订
For n = 1 To ActiveDocument.Revisions.Count
'移动至下一个修订
Selection.NextRevision (True)
'设置修订内容字体颜色为红色
Selection.Font.Color = wdColorRed
'接受当前修订
Selection.Range.Revisions.AcceptAll
Next n
End Sub

该代码能够实现包括doc和docx在内的Word文档修改内容标红并接受修订功能。使用方式为:

  1. 打开Word文档
  2. Alt+F11打开VBA界面。
  3. 在左侧窗格中选中Normal后,点击菜单栏-插入-模块,在弹出的窗口中粘贴上述代码。

  4. F5运行代码。
  5. 稍等片刻,等待程序运行完成即可。本人在 Word 2019上测试无任何问题,包括文本修改、图片插入、表格插入、域代码更新等均能识别,果然不愧是微软亲儿子……

至此,打完收工。


本文参考

  1. Word-接受全部修订为标红字体
  2. How to extract text inserted with track-changes in python-docx
  3. Track Changes in a Document
  4. Python 使用 win32com 模块对 word 文件进行操作
  5. Python - Using win32com.client to accept all changes in Word Documents
  6. How can I output Word documents/plaintext with all accepted/rejected track changes?
  7. Selecting and deleting a Line Present in a Word Document Using Python / Win32
  8. Revisions object (Word)

Word修订内容批量标红的更多相关文章

  1. iOS UILabel 使用姿势大全(标红关键字)

    一.初始化 ? 1 2 3 UILabel *myLabel = [[UILabel alloc] initWithFrame:CGRectMake(40, 40, 120, 44)];       ...

  2. 每日学习+AS小相册+导入图片标红的原因

    学习内容: 1.TextView(怎么设置文本). Button(怎么设置按钮事件). ImageView(怎么设置图片) 2.LinearLayout的基本使用 今日成果:做了一个小相册 遇到的问题 ...

  3. 利用POI 技术动态替换word模板内容

    项目中需要实现一个功能,动态替换给定模板里面的内容,生成word文档提供下载功能. 中间解决了问题有: 1.页眉的文档logo图片解决,刚开始的时候,HWPFDocument 对象无法读取图片对象(已 ...

  4. javaScript实现修改输入框之后标红

    <html> <title>实现标红</title> <script type="text/javascript">  functi ...

  5. Intellij IDEA @Override 标红

    Intellij IDEA 升级到15之后,之前那些@Override 的都标红,提示@Override is not allowed when implement interface method ...

  6. 第九篇、UITabbar增加类别用来标红点

    1.系统中只有设置bage的方式,设置为nil也是为一个红点,但是很大,并不是我们需要的 2.扩充标红点的方法 (常用于有新的动态提示标志) #import <UIKit/UIKit.h> ...

  7. python读取word表格内容(1)

    1.首页介绍下word表格内容,实例如下: 每两个表格后面是一个合并的单元格

  8. C#/VB.NET 操作Word批注(二)——如何插入图片、读取、回复Word批注内容

    序 在前面的文章C# 如何插入.修改.删除Word批注一文中介绍了如何操作Word批注的一些方法,在本篇文章中继续介绍操作Word批注的方法.分以下三种情况来介绍: 1. 插入图片到Word批注 2. ...

  9. OpenXml修改word特定内容

    采用OpenXml来修改word特定内容,如下: word: OpenXml修改word之前: OpenXml修改word之后: 代码: string path = @"C:\Users\A ...

随机推荐

  1. Eureka属性配置

    一:Eureka Instance实例信息配置   里面的配置以"-"隔开 其实也支持驼峰命名代替"-" 首先是入门时的配置: server: port: 80 ...

  2. 漏洞修复之Oracle系列

    Oracle 11g CVE-2012-1675(远程投毒)漏洞修复. 数据库版本 Oracle 11g 11.2.0.4.0非RAC 漏洞编号 CVE-2012-1675 漏洞介绍 Oracle允许 ...

  3. 借助SpotBugs将程序错误扼杀在摇篮中

    背景 最近一年多在一家toB业务的公司,部门主要做的是建筑行业的招投标业务信息化,希望借助软件来达到"阳光.降本.提效"的目的,我刚入职时大概30多家客户,截止现在已经超过100家 ...

  4. 安装@parcel/transformer-image注意的问题

    安装前配置 npm config get cache 键入以上命令即可找到npm缓存路径,然后找到路径下的_libvips文件夹. 一般需要以下两个文件,这里以win环境为例.把文件放到_libvip ...

  5. SAP Using Text Modules in Adobe Forms

    In this demo we will create an adobe form which displays text in two different languages (English or ...

  6. 动态树 — Link_Cut_Tree

    [模板]动态树(Link Cut Tree) Link-cut-tree是一种维护动态森林的数据结构,在需要动态加边/删边的时候就需要LCT来维护. Link-cut-tree的核心是轻重链划分,每条 ...

  7. C# / VB.NET 将Html转为Word

    本文分享以C#程序代码为例,实现将Html文件转换Word文档的方法(附VB.NET代码).在实际转换场景中可参考本文的方法,转换前,请按照如下方法引用Word API的dll文件到Visual St ...

  8. 【UR #2】猪猪侠再战括号序列 题解

    题目链接 前言 是的没脑子选手只会做签到题. 思路分析 一开始把题目看成反转括号的状态,直接浪费 \(40\ mins\) . 我们考虑把不确定的"正确括号"转换成一个固定的括号序 ...

  9. Tapdata Cloud 2.1.5来啦:新增支持Amazon RDS数据库,错误日志查询更便捷,Agent部署细节再优化

      需求持续更新,优化一刻不停--Tapdata Cloud 2.1.5 来啦!   最新发布的版本中,数据连接再上新,同时新增任务报错相关信息快速查询入口,开始支持 JVM 参数自定义设置.   更 ...

  10. 2022-07-21 第四组 java之继承

    目录 一.继承 1.概念 2.语法 3.父类成员访问 3.1 子类访问父类的成员变量 3.1.1 子类和父类中不存在同名的成员变量 3.1.2 子类和父类中不存在同名的成员变量 3.2 子类中访问父类 ...