「Python实用秘技04」为pdf文件批量添加文字水印
本文完整示例代码及文件已上传至我的
Github
仓库https://github.com/CNFeffery/PythonPracticalSkills
这是我的系列文章「Python实用秘技」的第4期,本系列立足于笔者日常工作中使用Python
积累的心得体会,每一期为大家带来一个3分钟即可学会的简单小技巧。
作为系列第4期,我们即将学习的是:为pdf文件批量添加文字水印
。
有些情况下我们需要为单个或多个pdf
文件添加文字水印,尤其是那种需要在每一页按照一定间距铺满的文字水印。而借助reportlab
和pikepdf
这两个实用的pdf
文件操作库,我们就可以很方便地实现批量文字水印添加工作。
利用pip install reportlab pikepdf
完成安装后,我们就可以按照步骤来实现需要的功能:
- 生成指定的文本水印pdf文件
为了向目标pdf
文件添加水印,我们首先需要有单独的pdf
格式的文本水印文件,我用reportlab
编写了一个方便易用的函数来生成水印文件,你可以通过注释来仔细学习其中的步骤,也可以直接调用即可:
from typing import Union, Tuple
from reportlab.lib import units
from reportlab.pdfgen import canvas
from reportlab.pdfbase import pdfmetrics
from reportlab.pdfbase.ttfonts import TTFont
# 注册字体,这里的字体是我从windows的字体目录下复制过来的
pdfmetrics.registerFont(TTFont('msyh', r'./msyh.ttc'))
def create_watermark(content: str,
filename: str,
width: Union[int, float],
height: Union[int, float],
font: str,
fontsize: int,
angle: Union[int, float] = 45,
text_stroke_color_rgb: Tuple[int, int, int] = (0, 0, 0),
text_fill_color_rgb: Tuple[int, int, int] = (0, 0, 0),
text_fill_alpha: Union[int, float] = 1) -> None:
'''
用于生成包含content文字内容的水印pdf文件
content: 水印文本内容
filename: 导出的水印文件名
width: 画布宽度,单位:mm
height: 画布高度,单位:mm
font: 对应注册的字体代号
fontsize: 字号大小
angle: 旋转角度
text_stroke_color_rgb: 文字轮廓rgb色
text_fill_color_rgb: 文字填充rgb色
text_fill_alpha: 文字透明度
'''
# 创建pdf文件,指定文件名及尺寸,这里以像素单位为例
c = canvas.Canvas(f"{filename}.pdf", pagesize = (width*units.mm, height*units.mm))
# 进行轻微的画布平移保证文字的完整
c.translate(0.1*width*units.mm, 0.1*height*units.mm)
# 设置旋转角度
c.rotate(angle)
# 设置字体及字号大小
c.setFont(font, fontsize)
# 设置文字轮廓色彩
c.setStrokeColorRGB(*text_stroke_color_rgb)
# 设置文字填充色
c.setFillColorRGB(*text_fill_color_rgb)
# 设置文字填充色透明度
c.setFillAlpha(text_fill_alpha)
# 绘制文字内容
c.drawString(0, 0, content)
# 保存水印pdf文件
c.save()
下面我们就利用这个函数来生成水印文件:
# 制造示例文字水印pdf文件
create_watermark(content='公众号【Python大数据分析】作者:费弗里',
filename='水印示例',
width=200,
height=200,
font='msyh',
fontsize=35,
text_fill_alpha=0.3)
看看效果,非常的不错,具体使用时,你可以自己动手调参以找到大小以及画幅都令你满意的水印导出结果:
- 将水印文件批量覆盖到目标pdf文件中
搞定了文本水印文件的生成之后,接下来我们就可以把现成的水印文件插入到目标pdf
文件中,这里我们使用pikepdf
中的相关功能就可以轻松实现,我写了一个简单的函数,大家在调用时只需要传入几个必要参数即可:
from typing import List
from pikepdf import Pdf, Page, Rectangle
def add_watermark(target_pdf_path: str,
watermark_pdf_path: str,
nrow: int,
ncol: int,
skip_pages: List[int] = []) -> None:
'''
向目标pdf文件中添加平铺水印
target_pdf_path: 目标pdf文件的路径+文件名
watermark_pdf_path: 水印pdf文件的路径+文件名
nrow: 水印平铺的行数
ncol:水印平铺的列数
skip_pages: 需要跳过不添加水印的页面序号(从0开始)
'''
# 读入需要添加水印的pdf文件
target_pdf = Pdf.open(target_pdf_path)
# 读入水印pdf文件并提取水印页
watermark_pdf = Pdf.open(watermark_pdf_path)
watermark_page = watermark_pdf.pages[0]
# 遍历目标pdf文件中的所有页(排除skip_pages指定的若干页)
for idx, target_page in enumerate(target_pdf.pages):
if idx not in skip_pages:
for x in range(ncol):
for y in range(nrow):
# 向目标页指定范围添加水印
target_page.add_overlay(watermark_page, Rectangle(target_page.trimbox[2] * x / ncol,
target_page.trimbox[3] * y / nrow,
target_page.trimbox[2] * (x + 1) / ncol,
target_page.trimbox[3] * (y + 1) / nrow))
# 将添加完水印后的结果保存为新的pdf
target_pdf.save(target_pdf_path[:-4]+'_已添加水印.pdf')
下面我们直接调用这个函数,对示例文件【吴恩达】机器学习训练秘籍-中文版.pdf
中除了封面以外的每一页,按照3行2列的平铺密度,添加上我们的示例水印:
add_watermark(target_pdf_path='./【吴恩达】机器学习训练秘籍-中文版.pdf',
watermark_pdf_path='./水印示例.pdf',
nrow=3,
ncol=2,
skip_pages=[0])
效果杠杠的,读者朋友们可以自己多试试,得到更多心得体会~
本期分享结束,咱们下回见~
「Python实用秘技04」为pdf文件批量添加文字水印的更多相关文章
- 「Python实用秘技01」复杂zip文件的解压
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的新系列文章「Python实用秘技」的第1 ...
- 「Python实用秘技02」给Python函数定“闹钟”
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第2期 ...
- 「Python实用秘技03」导出项目的极简环境依赖
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第3期 ...
- 「Python实用秘技05」在Python中妙用短路机制
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第5期 ...
- 「Python实用秘技06」逐行监听Python程序的内存消耗
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第6期 ...
- 「Python实用秘技07」pandas中鲜为人知的隐藏排序技巧
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第7期 ...
- 「Python实用秘技08」一行代码解析地址信息
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第8期 ...
- 「Python实用秘技09」更好用的函数运算缓存
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第9期 ...
- 「Python实用秘技10」深度比较Python对象间差异
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第10 ...
随机推荐
- bootstrap栅格例子
<div class="container-fluid "> <div class="row"> <div class=" ...
- docker启动报错:Failed to Setup IP tables: Unable to enable SKIP DNAT rule
Creating network "kafka_default" with the default driverERROR: Failed to Setup IP tables: ...
- 十行代码搭建基于.NET6三维应用程序
本文介绍在.NET6环境下如何集成Rapid SDK三维控件,请首先确保已经安装了Vistual Studio 2022,社区版就够用了. 1 创建项目 选择创建Windows窗体应用 给程序起一个酷 ...
- Visual Studio Code常用快捷键
说明 以下快捷键适用于windows环境下, Mac请将ctrl替换为command按键: 部分快捷键或不一样. 查看VSCode快捷键定义: settings -> keymaps. 目前使用 ...
- 【LeetCode】366. Find Leaves of Binary Tree 解题报告 (C++)
作者: 负雪明烛 id: fuxuemingzhu 个人博客:http://fuxuemingzhu.cn/ 目录 题目描述 题目大意 解题方法 DFS 日期 题目地址:https://leetcod ...
- 【九度OJ】题目1177:查找 解题报告
[九度OJ]题目1177:查找 解题报告 标签(空格分隔): 九度OJ http://ac.jobdu.com/problem.php?pid=1177 题目描述: 读入一组字符串(待操作的),再读入 ...
- LeetCode 第三大的数414. Third Maximum Number
题目 描述:给定数组中求第三大的数字:如果没有,返回最大的:时间复杂度O(n) 记得<剑指offer>才看到过这样的求第k大的题目.但是忘记具体怎么做了.只好先自己想了. 因为时间复杂度的 ...
- 湫湫系列故事——消灭兔子(hdu4544)
湫湫系列故事--消灭兔子 Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 65535/32768 K (Java/Others)Tota ...
- Linux学习笔记-韩顺平
这是我学习哔哩哔哩UP主韩顺平的2021韩顺平图解Linux课程的学习笔记. 课程地址:2021韩顺平图解Linux课程 Linux基础篇-Linux目录结构 基本介绍 linux 的文件系统是采用级 ...
- Electron-Vue 项目使用Element的el-table组件不显示
1.electron-vue文件夹下的webpack.renderer.config.js配置文件,你会找到这样一行代码,需要添加白名单! let whiteListedModules = ['vue ...