最全总结 | 聊聊 Python 办公自动化之 Excel(下)
1. 前言
前面谈到 Python 处理 Excel 文件最常见的两种方式,即:xlrd/xlwt、openpyxl
其中,
xlrd/xlwt 这一组合,xlrd 可以负责读取数据,而 xlwt 则负责写入数据,缺点是不支持 xlsx
openpyxl 同时支持对 Excel 文档的读取、写入操作,缺点是不支持 xls
本篇文章将继续聊聊 Python 操作 Excel 文档的其他几种方式
2. xlsxwriter
xlsxwriter 主要用于将数据、图表写入到 Excel 文件中,可以配置使用较小的内存快速写入数据
它的缺点是:无法读取、修改已有的 Excel 文件;如果需要读取修改 Excel 文件,只能搭配其他依赖库使用,比如:xlrd
首先安装 xlsxwriter 的依赖包
# 安装依赖包
pip3 install xlsxwriter
xlsxwriter 提供了 Workbook(filename) 方法,用于创建一个工作簿对象
使用工作簿对象的 add_worksheet(sheet_name) 函数,就可以在工作簿中创建 Sheet 了
def create_workbook_and_worksheet(filename, worksheet_names):
"""
创建工作簿和Sheet
:param filename: 文件名称
:param worksheet_names: sheet名称列表
:return:
"""
wb = xlsxwriter.Workbook(filename)
sheets = []
# 新增sheet
for worksheet_name in worksheet_names:
sheets.append(wb.add_worksheet(worksheet_name))
return wb, sheets
接着,就可以往某个 Sheet 单元格中写入数据了
如果需要定制单元格的样式,比如:字体大小、字体、颜色、背景、是否加粗等,可以使用工作簿对象的 add_format() 方法创建一个样式
def create_format_styles(wb, format_stuyles):
"""
创建一个样式,包含:字体大小、字体、颜色、背景、是否加粗等
:param wb:
:param format_stuyles:
:return:
"""
return wb.add_format(format_stuyles)
# 单元格字体样式
self.title_style = {'bold': True, 'bg_color': '#B0C4DE', 'font_size': 10,'font_name': 'Microsoft yahei'}
# 创建标题字体样式
title_font_style = create_format_styles(self.wb, self.title_style)
Sheet 对象的 write(...) 函数用于向单元格中写入数据,参数包含:行索引、列索引、值、字体样式等
需要注意的是,默认 xlsxwriter 的行索引、列索引都是从 0 开始,即: 0 代表第一行
写入数据的同时配置单元格样式的写法如下:
def write_to_cell(sheet, row_index, column_index, value, format_styles=None):
"""
往单元格中写入数据
:param row_index: 行索引,1:第一行
:param column_index: 列索引,1:第一列
:param format_styles 字体样式
:return:
"""
if row_index < 1 or column_index < 1:
print('参数输入不正确,写入失败!')
else:
# 注意:默认xlsxwriter的行索引、列索引从0开始
sheet.write(row_index - 1, column_index - 1, value, format_styles)
# 往worksheet中写入数据
# 第一行
write_to_cell(self.current_sheet, 1, 1, "姓名", title_font_style)
write_to_cell(self.current_sheet, 1, 2, "年龄", title_font_style)
# 第二行
write_to_cell(self.current_sheet, 2, 1, 'xingag')
write_to_cell(self.current_sheet, 2, 2, 23)
xlsxwriter 同样支持在单元格中插入图片,包含:本地图片和网络图片
使用的方法是:insert_image()
参数包含:单元格行索引(索引从 0 开始)、单元格列索引、图片文件、可选参数(图片位置、缩放、url 超链接、image_data 图片字节流等)
以插入一张网络图片为例
首先,定义一个图片展示可选参数,指定图片的缩放比、url 超链接
def create_image_options(x_offset=0, y_offset=0, x_scale=1, y_scale=1, url=None, tip=None, image_data=None,
positioning=None):
"""
插入图片的参数配置
包含:偏移量、缩放比、网络图片链接、超链接、悬停提示灯
:param x_offset:
:param y_offset:
:param x_scale:
:param y_scale:
:param url:
:param tip:
:param image_data:
:param positioning:
:return:
"""
image_options = {
'x_offset': x_offset,
'y_offset': y_offset,
'x_scale': x_scale,
'y_scale': y_scale,
'url': url,
'tip': tip,
'image_data': image_data,
'positioning': positioning,
}
return image_options
image_options = create_image_options(x_scale=0.5, y_scale=0.5, url='https://www.jianshu.com/u/f3b476549169')
接着,将网络图片转为字节流
from io import BytesIO
import ssl
def get_image_data_from_network(url):
"""
获取网络图片字节流
:param url: 图片地址
:return:
"""
ssl._create_default_https_context = ssl._create_unverified_context
# 获取网络图片的字节流
image_data = BytesIO(urlopen(url).read())
return image_data
最后,将图片插入到单元格中
def insert_network_image(sheet, row_index, column_index, url, filepath, image_options=None):
"""
插入网络图片
:param sheet:
:param row_index:
:param column_index:
:param url:
:param filepath:
:param image_options:
:return:
"""
if row_index < 1 or column_index < 1:
return "参数输入有误,插入失败!"
# 获取图片字节流
image_data = get_image_data_from_network(url)
if image_options:
image_options['image_data'] = image_data
print(image_options)
sheet.insert_image(row_index - 1, column_index - 1, filepath, image_options)
insert_network_image(self.current_sheet, 1, 1, url, '1.png', image_options4)
使用 set_column() 方法可以设置列宽
和 openpyxl 类似,有 2 种使用方式,分别是:字符串索引、列索引数字索引
def set_column_width(sheet, index_start, index_end, width):
"""
设置列宽
:param sheet:
:param index_start: 开始位置,从1开始
:param index_end: 结束位置
:param width: 宽度
:return:
"""
# 方式二选一
# self.current_sheet.set_column('A:C', width)
# 默认0代表第一列
sheet.set_column(index_start - 1, index_end - 1, width)
# 设置列宽度
# 设置第1列到第3列的宽度为:100
set_column_width(self.current_sheet, 1, 3, 100)
行高使用 set_row() 方法,传入行索引和高度即可
def set_row_height(sheet, row_index, height):
"""
设置行高
:param sheet:
:param row_index: 行索引,从1开始
:param height:
:return:
"""
sheet.set_row(row_index - 1, height)
# 设置行高
set_row_height(self.current_sheet, 1, 50)
set_row_height(self.current_sheet, 2, 100)
写入数据完毕之后,将工作簿关闭,文件会自动保存到本地
def teardown(self):
# 写入文件,并关闭文件
self.wb.close()
xlsxwriter 还支持插入图表,比如:条形图、柱状图、雷达图等,受限于篇幅,这部分内容就不展开说明了
3. 其他方式
还有一种比较常见的方式是:xlwings
xlwings 是一款开源免费的依赖库,同时支持 Excel 文件的读取、写入、修改
它功能非常强大,还可以和 Matplotlib、Numpy 和 Pandas 无缝连接,支持读写 Numpy、Pandas 数据类型;同时,xlwings 可以直接调用 Excel 文件中 VBA 程序
需要注意的是,xlwings 依赖于 Microsoft Excel 软件,所以使用 WPS 的用户建议直接使用 openpyxl
官方文档:
https://docs.xlwings.org/zh_CN/latest/quickstart.html
另外,还有一个操作 Excel 比较强大的方式,即:Pywin32
其中,
Pywin32 相当于调用 Win 下的系统 API 来操作 Excel 文件
优点是:可以处理复杂图表的数据表
缺点也非常明显,包含:速度慢、占用 CPU 高,仅支持 Win 系统
4. 最后
综合发现,xlrd/xlwt、openpyxl、xlsxwriter 基本上可以满足大部分的日常 Excel 文档操作
要获取全部源码,关注公众号「 AirPython 」,后台回复「 excel 」即可获得全部源码
如果你觉得文章还不错,请大家 点赞、分享、留言下,因为这将是我持续输出更多优质文章的最强动力!
推荐阅读
最全总结 | 聊聊 Python 办公自动化之 Excel(上)
最全总结 | 聊聊 Python 办公自动化之 Excel(中)
最全总结 | 聊聊 Python 办公自动化之 Excel(下)的更多相关文章
- 最全总结 | 聊聊 Python 办公自动化之 Excel(中)
1. 前言 上一篇文章中,我们聊到使用 xlrd.xlwt.xlutils 这一组合操作 Excel 的方法 最全总结 | 聊聊 Python 办公自动化之 Excel(上) 本篇文章将继续聊另外一 ...
- 最全总结 | 聊聊 Python 办公自动化之 Excel(上)
1. 前言 在我们日常工作中,经常会使用 Word.Excel.PPT.PDF 等办公软件 但是,经常会遇到一些重复繁琐的事情,这时候手工操作显得效率极其低下:通过 Python 实现办公自动化变的很 ...
- 最全总结 | 聊聊 Python 办公自动化之 Word(上)
1. 前言 日常自动化办公中,使用 Python 真的能做到事半功倍! 在上一个系列中,我们对 Python 操作 Excel 进行了一次全面总结 最全总结 | 聊聊 Python 办公自动化之 Ex ...
- 最全总结 | 聊聊 Python 办公自动化之 Word(中)
1. 前言 上一篇文章,对 Word 写入数据的一些常见操作进行了总结 最全总结 | 聊聊 Python 办公自动化之 Word(上) 相比写入数据,读取数据同样很实用! 本篇文章,将谈谈如何全面读取 ...
- 最全总结 | 聊聊 Python 办公自动化之 Word(下)
1. 前言 关于 Word 文档的读写,前面两篇文章分别进行了一次全面的总结 最全总结 | 聊聊 Python 办公自动化之 Word(上) 最全总结 | 聊聊 Python 办公自动化之 Word( ...
- 最全总结 | 聊聊 Python 办公自动化之 PDF(上)
1. 前言 自动化办公,非 Python 莫属! 从本篇文章开始,我们继续聊聊自动化办公中另外一个常用系列:PPT 2. 准备一下 Python 操作 PPT 最强大的依赖库是:python-pptx ...
- 最全总结 | 聊聊 Python 办公自动化之 PPT(中)
1. 前言 上一篇文章简单地介绍了 PPT 的文档结构,并使用 python-pptx 这个依赖库完成对 PPT 文档最基本的操作 最全总结 | 聊聊 Python 办公自动化之 PPT(上) 作为 ...
- 最全总结 | 聊聊 Python 数据处理全家桶(PgSQL篇)
1. 前言 大家好,我是安果! Python 数据处理全家桶,截止到现在,一共写过 6 篇文章,有兴趣的小伙伴可以去了解一下! 最全总结 | 聊聊 Python 数据处理全家桶(Mysql 篇) 最全 ...
- Python办公自动化之Excel做表自动化:全网最全,看这一篇就够了!
文章目录 很多人学习python,不知道从何学起.很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手.很多已经做案例的人,却不知道如何去学习更加高深的知识.那么针对这三类人,我给大家 ...
随机推荐
- SQL Server查询优化指南
1.尽量不要使用is null,否则将导致引擎放弃使用索引而进行全表扫描.2.char是固定长度,速度快,但占空间,varchar不固定长度,不占空间,但速度慢.3.能使用数字类型就不要使用字符,查询 ...
- 如何实现文章AI伪原创?
language-ai 文章AI伪原创,文章自动生成,NLP,自然语言技术处理,DNN语言模型,词义相似度分析.全网首个AI伪原创开源应用类项目. 点击右侧about内的链接极速体验! 代码托管在gi ...
- tomcat加载失败
tomcat启动加载信息如下: Connected to server [2017-10-16 09:02:28,149] Artifact basic-admin:war exploded: Art ...
- day29 Pyhton 面向对象 多态 封装
# coding:utf-8 # py2中的经典类 # class D:#没有继承object是经典类# pass # # def func(self): # # print('d') # class ...
- linux(centos8):firewalld使用ipset管理ip地址的集合
一,firewalld中ipset的用途: 1,用途 ipset是ip地址的集合, firewalld使用ipset可以在一条规则中处理多个ip地址, 执行效果更高 对ip地址集合的管理也更方便 2 ...
- centos8平台使用ethtool配置网卡
一,ethtool命令所属的包 [root@centos8 liuhongdi]# whereis ethtool ethtool: /usr/sbin/ethtool /usr/share/man/ ...
- 【事件中心 Azure Event Hub】使用Logstash消费EventHub中的event时遇见的几种异常(TimeoutException, ReceiverDisconnectedException)
问题描述 使用EFK(Elasticsearch, Fluentd and Kibana)在收集日志的解决方案中, 可以先把日志发送到EventHub中,然后通过Logstash消费EventHub中 ...
- GO用内置包写爬虫
一.要点 爬虫被想太多,把他当做一个模拟别人的请求响应即可了,所有呢go写爬虫关键是写请求 二.get请求 package main import ( "bytes" " ...
- I-Isolated Pointset
题意:给定T组数据,每组数据有一个数n,表示点集的个数,问是否存在一个点数为n的点集,使得任意两个点组成的边的垂直平分线过点集中的第三个点 本题非常巧妙,只需构造一个由(n-2)个相同共点(圆心)等边 ...
- 理解 Android Binder 机制(一):驱动篇
Binder的实现是比较复杂的,想要完全弄明白是怎么一回事,并不是一件容易的事情. 这里面牵涉到好几个层次,每一层都有一些模块和机制需要理解.这部分内容预计会分为三篇文章来讲解.本文是第一篇,首先会对 ...