最全总结 | 聊聊 Python 办公自动化之 PDF(上)
1. 前言
自动化办公,非 Python 莫属!
从本篇文章开始,我们继续聊聊自动化办公中另外一个常用系列:PPT
2. 准备一下
Python 操作 PPT 最强大的依赖库是:python-pptx
所以,在开始操作之前,我们需要在虚拟环境下安装这个依赖库
# 安装依赖
pip3 install python-pptx
3. PPT 结构
首先,我们需要了解一个 PPT 文档的页面结构
一个 PPT 文档对应一个 Presentation 对象
一个 Presentation 包含多个 Slide 对象,每一个 Slide 代表一个幻灯片
每一张幻灯片的内容都是由各种形状 Shape 组成
其次,PPT 中的内容元素都是由各种形状构成
比如:文字框、图片、占位符、表格、普通形状等
通过翻看源码,发现他们都定义在 MSO_SHAPE_TYPE 类中
最后,我们需要了解一下 PPT 中的 版式模板
使用 Presentation 对象的 属性方法 slide_layouts 可以获取内置的 11 种母版样式
# 使用Presentation获取PPT内置的11种版式样式
# 版式索引从0开始
slide_layout = presentation.slide_layouts[slide_style_index]
他们分别是:
Title Slide 标题幻灯片
Title and Content 标题和内容幻灯片
Section Header 节标题幻灯片
Two Content 两栏内容幻灯片
Comparison 比较幻灯片
Title Only 仅标题的幻灯片
Blank 空白幻灯片
Content with Caption 内容和标题的幻灯片
Picture with Caption 图片和标题的幻灯片
Title and Vertical Text 标题和竖排内容
Vertical Title and Text 竖排标题和文本
当然,也可以在 Microsoft PPT / WPS 中查看对应母版的样式
这里补充一下,除了内置的版式样式,也可以通过占位符 PlaceHolder 去自定义母版,满足一些特定的场景需求
4. 幻灯片管理
一个 PPT 文件是由一个或多张幻灯片组成
1-1 那如何添加一张一张幻灯片呢?
这里,只需要通过下面 3 个步骤
实例化一个 Presentation 对象
通过内置的版本样式,新建一个版本样式 Layout
通过版本样式 Layout,添加一张幻灯片
def add_slide(presentation, slide_style_index):
"""
在PPT文档中,以内置的版式添加幻灯片
:param presentation:文档对象
:param slide_style_index:版式索引
:return:
"""
# PPT版式样式
# 内置有11种版式样式
# 0:Title Slide 标题幻灯片
# 1:Title and Content 标题和内容
# 2:Section Header 节标题
# 3:Two Content 两栏内容
# 4:Comparison 比较
# 5:Title Only 仅标题
# 6:Blank 空白
# 7:Content with Caption 内容和标题
# 8:Picture with Caption 图片和标题
# 9:Title and Vertical Text 标题和竖排内容
# 10:Vertical Title and Text 竖排标题和文本
slide_layout = presentation.slide_layouts[slide_style_index]
# 通过样式Layout,新增一张幻灯片
slide = presentation.slides.add_slide(slide_layout)
return slide
# 1.1 新增幻灯片
slide1 = add_slide(self.presentation, 0)
slide2 = add_slide(self.presentation, 1)
slide3 = add_slide(self.presentation, 2)
slide4 = add_slide(self.presentation, 3)
1-2 获取已有的幻灯片或某一张幻灯片?
Presentation 对象的 slides 属性 会返回当前 PPT 文档中所有的幻灯片对象列表
def get_slides(presentation):
"""
获取所有的幻灯片
:param presentation:
:return:
"""
# 所有幻灯片
slides = presentation.slides
# 幻灯片数目
slide_num = len(slides)
return slides, slide_num
def get_slide(presentation, slide_index):
"""
根据索引,获取某一个幻灯片
:param presentation:
:param slide_index:页面索引,从0开始
:return:
"""
slides, slide_num = get_slides(presentation=presentation)
return slides[slide_index]
# 1.2.1 获取所幻灯片
slides, slide_num = get_slides(self.presentation)
print('现有幻灯片:', slides)
print('幻灯片数目:', slide_num)
# 1.2.2 获取某一个幻灯片
slide = get_slide(self.presentation, 1)
print(slide.shapes)
1-3 如果需要删除某一张幻灯片,如何破?
这个也简单,只需要先获取目前幻灯片对象,然后使用下面方法移除即可
def del_slide(presentation, slide_index=0):
"""
删除某一张幻灯片
:param presentation:
:param slide_index: 索引
:return:
"""
# 所有幻灯片的列表
slides = list(presentation.slides._sldIdLst)
# 根据索引,删除某一张幻灯片
presentation.slides._sldIdLst.remove(slides[slide_index])
# 1.3 根据索引,删除PPT文档中某一张幻灯片
# 比如:删除第4张幻灯片
del_slide(self.presentation, 3)
5. 文字及段落
我们首先需要指定一个幻灯片对象 Slide,它可以是已有的幻灯片,也可以是新建的一张幻灯片
接着,使用幻灯片对象的 slide.shapes 属性,获取当前幻灯片中的所有形状 Shape 组成的队列
最后利用形状队列的下面这个函数添加一个文本框,函数返回值为一个:文本框对象
add_textbox( left , top , width , height )
该函数参数分别为:
left 左边距
top 上边距
width 文字框宽度
height 文字框高度
这里需要引出另外一个概念:文字形状
PS:文字形状便于在文字框中添加段落和设置样式,通过「文本框对象」的属性函数 text_frame 获取
def insert_textbox(slide, left, top, width, height, unit=Inches):
"""
幻灯片中添加文本框
:param unit: 单元,默认设置为Inches
:param slide: 幻灯片对象
:param left: 左边距
:param top: 上边距
:param width: 宽度
:param height: 高度
:return:
"""
# 文本框
textbox = slide.shapes.add_textbox(left=unit(left),
top=unit(top),
width=unit(width),
height=unit(height))
# 文本框形状
tf = textbox.text_frame
return textbox, tf
为了便于使用,我对幻灯片中插入文字框这一动作进行了一次封装
长度单位默认设置为:Inches,也可以自定义为厘米等单位
接下来,我们来操作文字框及段落的常见操作
1-1 插入文本框,并设置默认段落内容
插入文本框的同时,文本框形状对象会自带一个段落,可以对这个段落设置内容
# 2、往幻灯片中插入一个文本框,返回一个文本框对象和一个文本框形状对象
textbox, tf = insert_textbox(slide, 8, 2, 10, 4, unit=Cm)
# 2.1 默认的段落
paragraph_default = tf.paragraphs[0]
paragraph_default.text = "设置段落默认的内容"
1-2 文本框中新增一个段落
查看源码发现,文本框形状对象是 TextFrame 的子类,因此可以使用 TextFrame 类中的 add_paragraph() 函数添加一个新的段落
# 2.2 添加一个新的段落
paragraph_new = tf.add_paragraph()
# 2.3 给段落设置内容
paragraph_new.text = "欢迎关注公众号:AirPython\n每周分享 Python 原创技术干货!"
1-3 设置段落及文字样式
和 Word 一样,使用 python-pptx 同样可以设置 PPT 文档的段落样式
其中
对齐方式:对齐方式是针对段落的,只需要指定段落对象的 alignment 的属性值即可
def set_parg_font_style(paragraph, font_name=None, font_color=None, font_size=-1, font_bold=False, font_italic=False,
paragraph_alignment=PP_ALIGN.CENTER):
"""
设置段落中文本的样式,包含:字体名称、颜色、大小、是否加粗、是否斜体
:param paragraph_alignment: 段落对齐方式
:param paragraph:
:param font_name:
:param font_color:
:param font_size:
:param font_bold:
:param font_italic:
:return:
"""
# 对齐方式
# 注意:对齐方式是针对段落的
paragraph.alignment = paragraph_alignment
# 获取段落中字体对象
font = paragraph.font
# 设置字体样式
set_font_style(font, font_name, font_color, font_size, font_bold, font_italic)
return font
段落文字属性:使用段落对象的 font 属性获取字体对象,接着设置字体名称、大小、颜色、是否斜体、加粗
def set_font_style(font, font_name=None, font_color=None, font_size=-1, font_bold=False, font_italic=False):
"""
设置字体样式
:param font:
:param font_name:
:param font_color:
:param font_size:
:param font_bold:
:param font_italic:
:return:
"""
# 字体名称
if font_name:
font.name = font_name
# 字体颜色
if font_color and len(font_color) == 3:
font.color.rgb = RGBColor(font_color[0], font_color[1], font_color[2])
# 字体大小
if font_size != -1:
font.size = Pt(font_size)
# 是否加粗,默认不加粗
font.bold = font_bold
# 是否倾斜,默认不倾斜
font.italic = font_italic
1-4 设置文字框的背景颜色
设置文字框背景颜色只需要 2 步
将形状的填充类型设置为纯色
设置文字框的背景颜色
def set_widget_bg(widget, bg_rgb_color=None):
"""
设置【文本框textbox/单元格/形状】的背景颜色
:param widget:文本框textbox、单元格、形状
:param bg_rgb_color:背景颜色值
:return:
"""
if bg_rgb_color and len(bg_rgb_color) == 3:
# 1、将形状填充类型设置为纯色
widget.fill.solid()
# 2、设置文本框的背景颜色
widget.fill.fore_color.rgb = RGBColor(bg_rgb_color[0], bg_rgb_color[1], bg_rgb_color[2])
# 4、设置文字框的背景颜色
set_widget_bg(textbox, [0, 255, 0])
需要指出的是,该方法同样适用于设置表格单元格、普通形状的背景颜色
1-5 文本框的自动对齐
一旦文本框设置一段很长的文字,单行可能显示不完全
这时候,我们只需要设置文字形状的 word_wrap 值为 True,则可以让文本框的文字自动换行显示
# 5、设置文本框的文字自动对齐
tf.word_wrap = True
6. 最后
受限于篇幅,本篇文章仅聊到了 PPT 的结构、幻灯片管理、段落及文字;更多复杂操作、项目实战,会在后面的文章中进行说明
要获取全部源码,关注公众号「 AirPython 」,后台回复「 ppt 」即可获得全部源码
如果你觉得文章还不错,请大家 点赞、分享、留言下,因为这将是我持续输出更多优质文章的最强动力!
推荐阅读
最全总结 | 聊聊 Python 办公自动化之 Excel(上)
最全总结 | 聊聊 Python 办公自动化之 Excel(中)
最全总结 | 聊聊 Python 办公自动化之 Excel(下)
最全总结 | 聊聊 Python 办公自动化之 Word(上)
最全总结 | 聊聊 Python 办公自动化之 Word(中)
最全总结 | 聊聊 Python 办公自动化之 Word(下)
最全总结 | 聊聊 Python 办公自动化之 PDF(上)的更多相关文章
- 最全总结 | 聊聊 Python 办公自动化之 Excel(中)
1. 前言 上一篇文章中,我们聊到使用 xlrd.xlwt.xlutils 这一组合操作 Excel 的方法 最全总结 | 聊聊 Python 办公自动化之 Excel(上) 本篇文章将继续聊另外一 ...
- 最全总结 | 聊聊 Python 办公自动化之 Excel(下)
1. 前言 前面谈到 Python 处理 Excel 文件最常见的两种方式,即:xlrd/xlwt.openpyxl 其中, xlrd/xlwt 这一组合,xlrd 可以负责读取数据,而 xlwt ...
- 最全总结 | 聊聊 Python 办公自动化之 Word(上)
1. 前言 日常自动化办公中,使用 Python 真的能做到事半功倍! 在上一个系列中,我们对 Python 操作 Excel 进行了一次全面总结 最全总结 | 聊聊 Python 办公自动化之 Ex ...
- 最全总结 | 聊聊 Python 办公自动化之 Word(中)
1. 前言 上一篇文章,对 Word 写入数据的一些常见操作进行了总结 最全总结 | 聊聊 Python 办公自动化之 Word(上) 相比写入数据,读取数据同样很实用! 本篇文章,将谈谈如何全面读取 ...
- 最全总结 | 聊聊 Python 办公自动化之 Word(下)
1. 前言 关于 Word 文档的读写,前面两篇文章分别进行了一次全面的总结 最全总结 | 聊聊 Python 办公自动化之 Word(上) 最全总结 | 聊聊 Python 办公自动化之 Word( ...
- 最全总结 | 聊聊 Python 办公自动化之 PPT(中)
1. 前言 上一篇文章简单地介绍了 PPT 的文档结构,并使用 python-pptx 这个依赖库完成对 PPT 文档最基本的操作 最全总结 | 聊聊 Python 办公自动化之 PPT(上) 作为 ...
- 最全总结 | 聊聊 Python 办公自动化之 Excel(上)
1. 前言 在我们日常工作中,经常会使用 Word.Excel.PPT.PDF 等办公软件 但是,经常会遇到一些重复繁琐的事情,这时候手工操作显得效率极其低下:通过 Python 实现办公自动化变的很 ...
- 最全总结 | 聊聊 Python 数据处理全家桶(PgSQL篇)
1. 前言 大家好,我是安果! Python 数据处理全家桶,截止到现在,一共写过 6 篇文章,有兴趣的小伙伴可以去了解一下! 最全总结 | 聊聊 Python 数据处理全家桶(Mysql 篇) 最全 ...
- 最全总结 | 聊聊 Python 数据处理全家桶(Mysql 篇)
1. 前言 在爬虫.自动化.数据分析.软件测试.Web 等日常操作中,除 JSON.YAML.XML 外,还有一些数据经常会用到,比如:Mysql.Sqlite.Redis.MongoDB.Memch ...
随机推荐
- 思维导图MindManager属性功能怎么合理使用
在MindManager中为主题添加相应的标注可以使读者更好的理解主题内容,增强导图的可读性,因此,如何在MindManager中为主题添加标注也就成了我们的关注点. 巧妙使用这款思维导图软件的属性功 ...
- Nacos安装与启动教程
前言 Nacos是阿里巴巴集团开源的一个易于使用的平台,专为动态服务发现,配置和服务管理而设计,Nacos基本上支持现在所有类型的服务,例如,Dubbo / gRPC服务,Spring Cloud R ...
- Nginx搭建文件共享服务器
前言 Nginx除了做正反向代理和负载均衡,还能做动静分离服务器,如此便可以当作文件共享服务器使用. 环境 WIN 10 Vmware Workstation 15 Player CentOS Lin ...
- selenium元素定位不到问题分析及解决办法
最近正在学习写自动化测试脚本,遇到一个错误迟迟未解决,导致自信心大受挫败,甚至想放弃. 思考许久突然想到,我遇到的问题是否也有人会遇到,如果有的话问题就应该有解决办法了.没什么问题是百度解决不了的,如 ...
- Contest 985
A 均移到黑色或白色即可. 时间复杂度 \(O\left(n\log n\right)\). B 枚举每种开关判断是否有灯只能靠该种开关控制. 时间复杂度 \(O\left(nm\right)\). ...
- Codeforces Round #668 C. Balanced Bitstring (Div. 2)题解(思维)
题目链接 题目大意 给你一个长为n的01串,要你使得每一个01串中0和1的个数都要相等,01串中有?字符,你可以使得这个字符变为0或1,要你求是否可以满足条件.输出YES或NO 题目思路 这个题目的难 ...
- C++实现任意进制的相互转换
进制转换是计算机内部时时刻刻都在进行活动,本篇文章也是进制转换的算法介绍,不过不同的是我想利用ascll编码实现2到61之间任意进制的相互转换,更大进制的表示方法只不过是十六进制表示方法的延伸:用字母 ...
- Gradle DSL method not found: 'google()'
报错信息如下:Gradle DSL method not found: 'google()'Possible causes:<ul><li>The project 'JustT ...
- DBeaver连接达梦|虚谷|人大金仓等国产数据库
前言 工作中有些项目可能会接触到「达梦.虚谷.人大金仓」等国产数据库,但通常这些数据库自带的连接工具使用并不方便,所以这篇文章记录一下 DBeaver 连接国产数据库的通用模版,下文以达梦为例(其他国 ...
- Spring Cloud 学习 (二) Ribbon
负载均衡是指将负载分摊到多个执行单元上,常见的负载均衡有两种方式:一种是独立进程单元,通过负载均衡策略,将请求转发到不同的执行单元上,例如 Ngnix:另一种是将负载均衡逻辑以代码的形式封装到服务消费 ...