python-docx 使用教程
快速入门
入门python-docx
很容易。让我们来看一下基础知识。
打开文档
你需要的第一件事是工作的文档。最简单的方法是:
from docx import Document document = Document()
这将打开一个基于默认“模板”的空白文档,您可以打开并使用现有的Word文档的工作python-docx
,我们会让事情变得简单。
增加一段
段落是Word的基础。它们用于正文文本,但也用于标题和列表项目(如项目符号)。
这里是添加一个最简单的方法:
paragraph = document.add_paragraph('Lorem ipsum dolor sit amet.')
此方法返回对段落的引用,新添加的段落在文档的结尾。新的段落引用被分配给paragraph
在这种情况下,我将要离开了这一点在下面的例子中,除非我有一个需要它。在你的代码中,通常你不会对项目做任何事情,在添加它,所以没有什么意义,保持引用它挂在周围。
还可以使用一个段落作为“光标”,并在其上直接插入一个新段落:
prior_paragraph = paragraph.insert_paragraph_before('Lorem ipsum')
这允许将一个段落插入到文档的中间,这在修改现有文档时通常很重要,而不是从头开始生成。
添加标题
在除了最短文档之外的任何内容中,正文文本被分成多个部分,每个部分以一个标题开始。以下是如何添加一个:
document.add_heading('The REAL meaning of the universe')
默认情况下,这会添加顶级标题,Word中显示为“标题1”。当您需要子节的标题时,只需指定所需的级别为1到9之间的整数:
document.add_heading('The role of dolphins', level=2)
如果指定级别0,将添加“标题”段落。这可以方便地启动一个相对较短的文档,没有单独的标题页。
添加分页符
每隔一段时间,你想要下一个文本在一个单独的页面,即使你所在的一个不是满的。“hard”分页符可以做到这一点:
document.add_page_break()
如果你发现自己经常使用它,这可能是一个标志,你可以通过更好地了解段落样式受益。可设置的一个段落样式属性是在包含该样式的每个段落之前立即断开页面。因此,您可以将标题设置为某个级别,以便始终启动新页面。更多风格后。它们对于真正充分利用Word至关重要。
添加表
一个经常遇到的内容,它自己的表格呈现,排列在整齐的行和列。Word在这方面做得相当不错。以下是添加表格的方法:
table = document.add_table(rows=2, cols=2)
表具有几个属性和方法,您将需要它们来填充它们。访问单个单元格可能是一个好的开始的地方。作为基线,您可以始终按其行和列指示访问单元格:
cell = table.cell(0, 1)
这就给出了我们刚刚创建的表格最上面一行的右边单元格。注意,行和列指示是基于零的,就像在列表访问中一样。
一旦你有一个单元格,你可以把东西在它:
cell.text = 'parrot, possibly dead'
通常,一次访问一行单元格更容易,例如,当从数据源填充可变长度的表时。在.rows
一个表中的属性提供给单独的行,每个都具有一个 .cells
属性。该.cells
两个物业Row
和Column
支持索引访问,就像一个列表:
row = table.rows[1]
row.cells[0].text = 'Foo bar to you.'
row.cells[1].text = 'And a hearty foo bar to you too sir!'
在.rows
和.columns
桌子上的集合是可迭代的,这样你就可以直接在使用它们for
循环。相同的.cells
上行或列序列:
for row in table.rows:
for cell in row.cells:
print(cell.text)
如果你想在表中的行或列的计数,只要使用len()
的顺序:
row_count = len(table.rows)
col_count = len(table.columns)
您还可以以递增方式向表中添加行,如下所示:
row = table.add_row()
这对于我们上面提到的可变长度表场景非常方便:
# get table data -------------
items = get_things_from_database_or_something() # add table ------------------
table = document.add_table(1, 3) # populate header row --------
heading_cells = table.rows[0].cells
heading_cells[0].text = 'Qty'
heading_cells[1].text = 'SKU'
heading_cells[2].text = 'Description' # add a data row for each item
for item in items:
cells = table.add_row().cells
cells[0].text = str(item.qty)
cells[1].text = item.sku
cells[2].text = item.desc
同样的工作对列,虽然我还没有看到它的一个用例。
Word具有一组预格式化的表格样式,您可以从其表格样式库中选择。您可以将其中的一个应用于表格,如下所示:
table.style = 'LightShading-Accent1'
通过从表样式名称中删除所有空格形成样式名称。通过将鼠标悬停在Word的表样式库中的缩略图上,可以找到表样式名称。
添加图片
Word中,您可以将图像使用的文档中的菜单项。以下是如何做到这一点的:Insert > Photo > Picture fromfile...
python-docx
document.add_picture('image-filename.png')
此示例使用路径,从本地文件系统加载图像文件。你也可以使用一个类文件对象,本质上就像一个打开的文件的任何对象。如果您从数据库或网络检索图像,并且不想获取涉及的文件系统,这可能很方便。
图像大小
默认情况下,添加图像出现在本地的大小。这通常比你想要的更大。本机大小的计算方法。因此,具有300dpi分辨率的300×300像素图像出现在一平方英寸。问题是大多数图像不包含dpi属性,它默认为72 dpi。这将使同一图像在一边,在一半左右的某处出现4.167英寸。pixels / dpi
要获得所需的图像大小,您可以以方便的单位指定其宽度或高度,如英寸或厘米:
from docx.shared import Inches document.add_picture('image-filename.png', width=Inches(1.0))
你可以自由地指定宽度和高度,但通常你不想要。如果仅指定一个,python-docx
用它来计算出其他的适当换算值。这样的高宽比是保留的,你的图像看起来不拉伸。
在Inches
和Cm
提供课程,让你指定派上用场单位进行测量。在内部,python-docx
使用英语公制单位,914400为英寸。所以,如果你忘记了,只是把喜欢的东西width=2
,你会得到一个非常小的图像:)。你需要从导入docx.shared
子包。你可以在算术中使用它们,就像它们是一个整数,事实上它们是。因此,像一个表达式的作品就好了。width = Inches(3) /thing_count
应用段落样式
如果你不知道一个Word段落风格是你应该肯定检查出来。基本上,它允许您将一整套格式化选项立即应用到段落。这很像CSS样式,如果你知道那些是。
您可以在创建段落时应用段落样式:
document.add_paragraph('Lorem ipsum dolor sit amet.', style='ListBullet')
这种特殊的风格导致段落显示为一个子弹,一个非常方便的东西。您也可以在之后应用样式。这两行相当于上面的一行:
paragraph = document.add_paragraph('Lorem ipsum dolor sit amet.')
paragraph.style = 'ListBullet'
在此示例中,样式使用其样式ID“ListBullet”指定。通常,通过去除样式名称中出现在Word用户界面(UI)中的空格来形成样式ID。所以风格'列表3号'将被指定为'ListNumber3'
。但是,请注意,如果您使用的是本地化版本的Word,则样式ID可能来自英语样式名称,并且可能不会完全对应于其在Word UI中的样式名称。
应用粗体和斜体
为了理解如何大胆和斜体的工作,你需要了解一个段落里面发生了什么。简短的版本是这样的:
- 一个段落包含所有的块级格式,如缩进,行高,制表符,等等。
- 字符级格式,如粗体和斜体,都在应用的 运行水平。段落中的所有内容必须在一个运行中,但可以有多个。因此,在中间有一个粗体字的段落需要三个段落,一个正常的段落,一个包含该单词的粗体,以及另一个正常的段落。
当您的提供文本添加段落.add_paragraph()
的方法,它被放入一个单一的运行。您可以添加更多的使用.add_run()
上一段方法:
paragraph = document.add_paragraph('Lorem ipsum ')
paragraph.add_run('dolor sit amet.')
这将产生一个看起来像从单个字符串创建的段落。除非你看看XML,段落文本被分成几个部分并不明显。注意第一个字符串末尾的尾部空格。您需要明确在运行的开始和结束位置出现的位置。它们不会在运行之间自动插入。期待被那一个被抓住几次:)。
Run
对象既有.bold
和.italic
属性,您可以设置其值为运行:
paragraph = document.add_paragraph('Lorem ipsum ')
run = paragraph.add_run('dolor')
run.bold = True
paragraph.add_run(' sit amet.')
其产生的文字,看起来像这样:'Lorem存有悲坐阿梅德。“
请注意,您可以对结果集粗体或斜体正确的.add_run()
,如果你不需要它为别的:
paragraph.add_run('dolor').bold = True # is equivalent to: run = paragraph.add_run('dolor')
run.bold = True # except you don't have a reference to `run` afterward
它不是必须提供的文字给.add_paragraph()
方法。这可以使你的代码更简单,如果你从建立段从运行反正:
paragraph = document.add_paragraph()
paragraph.add_run('Lorem ipsum ')
paragraph.add_run('dolor').bold = True
paragraph.add_run(' sit amet.')
应用字符样式
除了段落样式,其中指定一组段落级别设置,Word有字符样式其指定一组运行级别设置。一般来说,您可以将字符样式视为指定字体,包括其字体,大小,颜色,粗体,斜体等。
像段落样式,字符样式必须已经与你在打开的文档中定义的Document()
调用(参见 了解样式)。
添加新运行时可以指定字符样式:
paragraph = document.add_paragraph('Normal text, ')
paragraph.add_run('text with emphasis.', 'Emphasis')
您还可以在运行创建后将样式应用于运行。此代码产生的结果与上面的行相同:
paragraph = document.add_paragraph('Normal text, ')
run = paragraph.add_run('text with emphasis.')
run.style = 'Emphasis'
与段落样式一样,通过删除名称中出现在Word UI中的空格形成样式ID。所以风格'微妙强调'将被指定为'SubtleEmphasis'
。请注意,如果您使用的是本地化版本的Word,则样式ID可能来自英语样式名称,并且可能不对应于其在Word UI中的样式名称。
document.add_page_break() 本文为博主原创文章,转载请注明出处
http://www.cnblogs.com/rencm/p/6285304.html
python-docx 使用教程的更多相关文章
- 用命令访问D:\python学习\wendjia教程\aa.py
用命令访问D:\python学习\wendjia教程\aa.py d: -----------切换到D盘 cd python学习\wend ...
- Python小白好教程
提供一些Python的基础教程. Crossin的编程教师:网址:http://crossincode.com/home/ 廖雪峰的官方网站 网址:http://www.liaoxuefeng.com ...
- 七牛云存储Python SDK使用教程 - 上传策略详解
文 七牛云存储Python SDK使用教程 - 上传策略详解 七牛云存储 python-sdk 七牛云存储教程 jemygraw 2015年01月04日发布 推荐 1 推荐 收藏 2 收藏,2.7k ...
- Python学习入门教程,字符串函数扩充详解
因有用户反映,在基础文章对字符串函数的讲解太过少,故写一篇文章详细讲解一下常用字符串函数.本文章是对:程序员带你十天快速入门Python,玩转电脑软件开发(三)中字符串函数的详解与扩充. 如果您想学习 ...
- Python基础入门教程
Python基础入门教程 Python基础教程 Python 简介 Python环境搭建 Python 基础语法 Python 变量类型 Python 运算符 Python 条件语句 Python 循 ...
- 小白必看Python视频基础教程
Python的排名从去年开始就借助人工智能持续上升,现在它已经成为了第一名.Python的火热,也带动了工程师们的就业热.可能你也想通过学习加入这个炙手可热的行业,可以看看Python视频基础教程,小 ...
- Python爬虫入门教程 48-100 使用mitmdump抓取手机惠农APP-手机APP爬虫部分
1. 爬取前的分析 mitmdump是mitmproxy的命令行接口,比Fiddler.Charles等工具方便的地方是它可以对接Python脚本. 有了它我们可以不用手动截获和分析HTTP请求和响应 ...
- Python爬虫入门教程 43-100 百思不得姐APP数据-手机APP爬虫部分
1. Python爬虫入门教程 爬取背景 2019年1月10日深夜,打开了百思不得姐APP,想了一下是否可以爬呢?不自觉的安装到了夜神模拟器里面.这个APP还是比较有名和有意思的. 下面是百思不得姐的 ...
- Python数据分析基础教程
Python数据分析基础教程(第2版)(高清版)PDF 百度网盘 链接:https://pan.baidu.com/s/1_FsReTBCaL_PzKhM0o6l0g 提取码:nkhw 复制这段内容后 ...
- python基础系列教程——Python中的编码问题,中文乱码问题
python基础系列教程——Python中的编码问题,中文乱码问题 如果不声明编码,则中文会报错,即使是注释也会报错. # -*- coding: UTF-8 -*- 或者 #coding=utf-8 ...
随机推荐
- vue子组件传参给父组件
关于父组件传参给子组件,可以看我另一篇文章 教程开始: 我们要实现的效果是:在子组件的Input框输入,父组件中实时更新显示.(也就是把子组件中的数据传给父组件) 一.子组件代码 template部分 ...
- Python学习--12 异常处理、调试
异常捕获 语法格式: try: pass except xxx as e: pass except xxx as e: pass ... else: pass finally: pass except ...
- 最常用的两种C++序列化方案的使用心得(protobuf和boost serialization)
导读 1. 什么是序列化? 2. 为什么要序列化?好处在哪里? 3. C++对象序列化的四种方法 4. 最常用的两种序列化方案使用心得 正文 1. 什么是序列化? 程序员在编写应用程序的时候往往需要将 ...
- 数据绑定到ADO.NET
// Define a DataSet with a single DataTable. DataSet dsInternal = new DataSet(); dsInternal.Tables.Ad ...
- Pro * c Oracle 12c
#include<stdio.h> #include<string.h> #include<stdlib.h> #include<sqlca.h> vo ...
- (转)request.getSession()几种获取情况之间的差异
一.三种情况 HttpSession session = request.getSession(); HttpSession session = request.getSession(true); H ...
- dom操作------操作元素属性的若干方法
// 1,通过HTMLElement类型的属性来获得和设置元素特性(设置的是元素属性,比如class,id,title,而不是css样式,比如float,border等)let div = docum ...
- 表格(Table)隔行变色
在ASP.NET的Repeater控件,实现隔行变色,是极简单的事情.因为它有ListItemType.Item和ListItemType.AlternatingItem模版.如果在普通的表格(Tab ...
- iis 程序池设置及详解-20180720
[非原创,好文收藏,分享大家] 公司的一个网站程序长时间运行后,速度变慢,重新启动网站后速度明显变快,估计是网站程序占用的内存和CPU资源没能及时释放,才需要每隔一段时间重启网站释放资源.但手工重启总 ...
- Java集合类源码解析:LinkedHashMap
前言 今天继续学习关于Map家族的另一个类 LinkedHashMap .先说明一下,LinkedHashMap 是继承于 HashMap 的,所以本文只针对 LinkedHashMap 的特性学习, ...