Python自动合并Word文件同时添加分页符的方法

本文介绍基于Python，实现对多个Word文档加以自动合并，并在每次合并时按要求增添一个分页符的方法。

现有多个Word文档文件，需将其按名称顺序合并为一个新的Word文件，且需保证每一次合并时，都另起一页（即新的Word文件一页中，不能出现两个及以上的原本单个Word文件的内容）。

一般的，实现多个Word文件的合并，在Word中可以通过“插入”→“文本”→“对象”的方式进行，较为方便。

在弹出的窗口中选择需要合并的Word文件即可。

但是，这种方法工作量较大，且无法满足合并时另起一页的要求。例如，如果原本有两个Word文件，每个文件中都仅有一页，一页中仅在第一行有内容（这里假设是一行数字），则合并后的新Word文件同样为一页，该页中包含两行数字，即无法另起一页合并。

因此，本文就结合Python中python-docx（docx）模块与docxcompose模块，实现本文开头提及的需求。

首先安装python-docx模块。由于我用的是Anaconda，因此就直接在Anaconda Prompt (Soft)中加以安装。

打开Anaconda Prompt (Soft)。

在弹出的界面中输入：

conda install -c conda-forge python-docx

输入y，开始安装。

随后即可安装完成。

接下来安装docxcompose，还是一样的操作。输入：

pip install docxcompose

安装完成后，即可开始代码的书写。整体代码如下：

import os

from docx import Document

from docxcompose.composer import Composer

original_docx_path='F:/其他学生工作/2020就业联络员/2021.06派遣材料与调档函/地信1701_就业派遣材料/'

new_docx_path='F:/其他学生工作/2020就业联络员/2021.06派遣材料与调档函/地信1701.docx'

all_word=os.listdir(original_docx_path)

all_file_path=[]

for file_name in all_word:

    all_file_path.append(original_docx_path+file_name)

master=Document(all_file_path[0])

middle_new_docx=Composer(master)

num=0

for word in all_file_path:

    word_document=Document(word)

    word_document.add_page_break()

    if num!=0:

        middle_new_docx.append(word_document)

    num=num+1

middle_new_docx.save(new_docx_path)

首先，对代码加以初步介绍。original_docx_path为存放需要合并的Word文件路径，new_docx_path为需要合并入其中的Word文件，这里大家直接在目标路径下新建一个Word文件并重命名为需要的文件名即可。

随后，通过os.listdir获取所有需要合并的Word文件文件名。在这里需要注意，如果需要按照文件名称作为合并顺序，大家直接在资源管理器中调整文件排序方法为名称即可。随后通过.append()逐一将文件名称与其路径合并。

接下来，设立一个Word文件模板master。其实这个模板就是限定了合并完成后的新Word文件的字体等格式，如果我们不设置模板，就会用docx模块中的默认模板，导致合并后的文件字体与合并前的文件字体不一致（内容是一致的，主要是字体等格式会出问题）。在这里，为了保证合并完成后的新Word文件的字体等格式与合并前文件一致，直接用all_file_path[0]（也就是即将要被合并的第一个文件）作为模板即可。其次，将模板用Composer()激活（这里Composer函数个人认为就是激活的作用），从而将其作为模板格式，对多个待合并的文件加以约束。

最后，由于需要保证每一次合并都另起一页，便用.add_page_break()函数，在每一次合并前将这一待合并的文件末尾增添分页符。同时，由于我们用了第一个待合并文件作为模板，因此后期只需要从第二个文件开始进行合并即可（可以理解为，文件一旦选择为模板，其自动完成了自身的合并）。最后保存文件即可。

综上，便完成了“按名称顺序合并为一个新的Word文件，且需保证每一次合并时，都另起一页”的需求。但是需要注意，这一方法对于较为复杂的Word文件（例如含有文本框等形式内容的文件）不能实现合并，会报错；对于含有普通文字、图片等的Word文件而言，还是很方便的~

Python自动合并Word文件同时添加分页符的方法的更多相关文章

借助python工具从word文件中抽取相关表的定义，最后组装建表语句-非常好
借助python工具从word文件中抽取表的定义,最后组装建表语句-非常好 --如有转载请以超链接的方式注明原文章出处,谢谢大家.请尊重每一位乐于分享的原创者 1.python脚本 ## -*- co ...
【word xml】将word转化为xml格式后，如何在xml中卫word添加分页符
1.首先在xml中找到我们需要添加分页符的位置例如:我需要在这个第一部分上面添加一个分页符 2.找到这个[第一部分]这个位置之后,开始往上找,找到对应的位置 3.在</w:pPr>下方添 ...
Android开发过程中在sh，py，mk文件中添加log信息的方法
Android开发过程中在sh,py,mk文件中添加log信息的方法在sh文件中: echo "this is a log info" + $info 在py文件中: print ...
python自动更新pom文件
前言项目越来越多,版本管理越来越麻烦,在项目上我使用 maven version 来进行版本管理.主要还是在分布式项目中模块众多的场景中使用,毕竟各个模块对外的版本需要保持统一. 关于这个插件如何使 ...
使用Python批量合并PDF文件(带书签功能)
网上找了几个合并pdf的软件,发现不是很好用,一般都没有添加书签的功能. 又去找了下python合并pdf的脚本,发现也没有添加书签的功能的. 于是自己动手编写了一个小工具,使用了PyPDF2. 下面 ...
[转载]java合并word文件
需求背景在互联网教育行业,做内容相关的项目经常碰到的一个问题就是如何动态生成一张word试卷.事先把题库中的每一道试题都已经保存成一个独立的word文件了,但是在选择了部分试题生成一张word试卷的 ...
[原创]java合并word文件
需求背景在互联网教育行业,做内容相关的项目经常碰到的一个问题就是如何动态生成一张word试卷.事先把题库中的每一道试题都已经保存成一个独立的word文件了,但是在选择了部分试题生成一张word试卷的 ...
python 自动生成model 文件案例分析
生成方式 Python中想要自动生成 model文件可以通过 sqlacodegen这个命令来生成对应的model文件 sqlacodegen 你可以通过pip去安装: pip install sql ...
WORD学习之插入分页符
我们在用Word编辑文档时,不可避免的需要对文档进行页面布局,才能使得文档看起来更加美观.有时候会使用到分页符,下面就简单介绍一下分页符分页符主要作用: 1.若要把两段分开在两页显示时,把光标定位 ...
Python自动批量修改文件名称的方法
本文介绍基于Python语言,按照一定命名规则批量修改多个文件的文件名的方法. 已知现有一个文件夹,其中包括班级所有同学上交的作业文件,每人一份:所有作业文件命名格式统一,都是地信1701_姓 ...

随机推荐

关于 python 中比较运算的顺序
先来看一个例子: "x" > "y" == True 结果为 False 因为这里的表达式可以等同于 "x" > "y ...
2.5：Python常用内置数据结构、多维数组ndarray、Series和DataFrame
一.Python内置数据结构 1.赋值生成列表 la=[1,2,3,4] la 2.强制转换为列表 lb=list("Hello") lb 3.推导式生成列表 s="ab ...
【数据库】union和union all合并结果操作
一.含义 UNION 操作符用于合并两个或多个 SELECT 语句的结果集. UNION 内部的 SELECT 语句必须拥有相同数量的列.列也必须拥有相似的数据类型.同时,每条 SELECT 语句中的 ...
【每日一题】【位于index后的双指针&排序数组】15. 三数之和/NC54 数组中相加和为0的三元组-211117/220206
给你一个包含 n 个整数的数组 nums,判断 nums 中是否存在三个元素 a,b,c ,使得 a + b + c = 0 ?请你找出所有和为 0 且不重复的三元组. 注意:答案中不可以包含重复的三 ...
【JVM调优】Day04：总结前三日内容（GC+算法*4+简单回收器*3三色标记，CMS+G1+ZGC，参数个数+OOM+调优参数）
基于opencv实现简单人脸检测
作用:在视频中自动检测出人脸使用内容:灰度转换,分类器,矩形框选,圆形框选,摄像头读取及释放代码逻辑: 先读取摄像头后, 对摄像头拍摄到的图片进行逐帧分析, 并对图像进行灰度转换后使用类选择器识别 ...
SpringBoot 自动装配的原理分析
关于 SpringBoot 的自动装配功能,相信是每一个 Java 程序员天天都会用到的一个功能,但是它究竟是如何实现的呢?今天阿粉来带大家看一下. 自动装配案例首先我们通过一个案例来看一下自动装配 ...
多线程爬取wallhaven
前言最近整理自己的项目时,发现之前自己写的爬取wallhaven网站顿时有来的兴趣决定再写一遍来回顾自己以前学的知识网站地址:"https://wallhaven.cc/" 1 ...
linux系统中安装虚拟机
在linux系统中,利用图形化界面安装虚拟机.首先启动 virt-manager,当然没有安装 virt-manager需要先安装好. 1 $ apt-get install virt-manager ...
[OpenCV实战]19 使用OpenCV实现基于特征的图像对齐
目录 1 背景 1.1 什么是图像对齐或图像对准? 1.2 图像对齐的应用 1.3 图像对齐基础理论 1.4 如何找到对应点 2 OpenCV的图像对齐 2.1 基于特征的图像对齐的步骤 2.2 代码 ...

Python自动合并Word文件同时添加分页符的方法

Python自动合并Word文件同时添加分页符的方法的更多相关文章

随机推荐

热门专题