Python | 使用Python操作Excel文档(一)

0 前言

在阅读本文之前,请确保您已满足或可能满足以下条件:

  1. 请确保您具备基本的Python编程能力。

  2. 请确保您会使用Excel。

  3. 请确保您的电脑已经安装好Python且pip可用。

另外操作Excel需要使用openpyxl模块,请安装好该模块:

pip install openpyxl

演示环境:

  1. 演示环境为win10+Python3.6

  2. openpyxl版本为2.6.2

  3. 调试工具为IDLE

1. openpyxl简述

openpyxl操作Excel的第三方库,作者是Eric Gazoni, Charlie Clark。您也可以访问openpyxl的官方网站通过官方手册进行学习。同时附上官方网站的地址:

https://openpyxl.readthedocs.io/en/stable/index.html。

目前openpyxl的最新版本是2.6.2版本。在openpyxl之前,我们使用xlrd和xlwt来操作Excel表格,事实上这两个库也非常好用,一读一写,然而遗憾的是它们只能操作2003及以前的版本,而openpyxl却能支持2010版本。

另外这里附上源码地址,感兴趣的同学可以自行下载学习或者参与开发:

http://bitbucket.org/openpyxl/openpyxl/src

2. 创建/读取一个Excel工作簿

我们知道一个xlsx文件叫做工作簿,工作簿中的每一张表叫做工作表,表中每个格叫做单元格。

创建工作簿,示例代码如下:

from openpyxl import Workbook
wb = Workbook().save("example.xlsx")

Workbook对象是一个用来创建一个工作簿,save方法用来将这个对象保存成一个文件。

可以查看一下,程序执行的目录下是不是出现了一个example.xlsx文件。这时,是一个全新的文件,里面只有一张默认的表。

读取已存在的xlsx文件,使用openpyxl中的load_wordbook()方法。示例代码如下:

from openpyxl import load_workbook
wb = load_workbook("example.xlsx")

4. 操作Excel表:读取,创建,删除,复制

每个工作表都是一个Worksheet对象。

首先访问wb的sheetnames属性来获取文件中的所有工作表的名字,:

wb.sheetnames # ['Sheet']

一般来说,当我们打开一个Excel表格,会看到上次我们保存的表。这个表是活动状态的。我们可以使用Workbook类中的active属性来读取这张表。

ws = wb.active 

ws就是我们要操作的表了。你可以使用ws的title属性来获取表明,一般当我们创建一个xlxs文件的时候,会默认创建一张表Sheet,接下来我们对ws的操作,就是对这张表的操作,可以理解成对ws的操作会反映到这张表上。

例如访问ws的title属性,可以获取或修改表名。ws是一个Worksheet对象,也可以使用Workbook类中的get_sheet_by_name("sheet_name")方法读取这张表。也可以使用wb[表名]的方式,但是旧版本的openpyxl可能会不知这种访问方式。使用title给这张表重命名:

ws.title # 'Sheet'
ws = wb.get_sheet_by_name("Sheet")
ws.title # 'Sheet'
ws.title = "demo"
wb.sheetnames # ['demo']
ws = wb["demo"]

创建一张表,使用Workbook中的create_sheet()方法:

 ws1 = wb.create_sheet("demo1")
 wb.sheetnames # ['demo', 'demo1']

删除一张表,使用Workbook中的remove_sheet()方法:

wb.remove_sheet(ws1) 
wb.sheetnames # ['demo']

需要注意的是,也可以使用wb.remove(ws1)del w["demo1"],但是不建议这种写法。

复制一张表,使用Workbook中的copy_worksheet()方法:

ws2 = wb.copy_worksheet(ws)
wb.sheetnames # ['demo', 'demo Copy']

PS:旧版的openpyxl可能不支持sheetnames属性,这时可以使用Workbook类中的get_sheet_names()方法,旧版中也可能不支持wb[表名]的访问方式以及active属性,这时可以使用get_active_sheet()方法

5. 操作单元格

每个单元格都是一个Cell对象。

访问单元格,需要使用坐标,坐标的表示方式有两种,一种是使用字符串,如‘A1’,表示的是第一列,第一行。。另一种就是使用标准得坐标如,column=1, row=1,利用ws中的cell方法来第一行第一列的单元格。访问单元格的方式是使用如ws['A1'], 即表变量[坐标]

ws['A1'] = 0
ws.cell(row=1, column=1, value=0)
print(ws['A1'].value) # 0

需要强调的是,虽然可以直接给单元格赋值,但是要读取这个值,还是需要访问Cell类中的value属性的。而且坐标必须从1开始。

PS:部分旧版可能不支持表变量[坐标]的访问方式,这时,可以使用ws.Cell('A1')或ws.Cell(column=1, row=1)的方式来访问。

6. 向表中写入大量数据

for i in range(1, 20):
    for j in range(1, 20):
        ws.cell(i,j,value=i*j)

需要注意的是,使用cell时,坐标至少是1,也就是说,大于0的整数。

wb.save("example.xlsx")

好,到这里,我们保存,来看下效果。

7.复习下今天内容

关于使用openpyxl操作Excel文档,应该要先了解openpyxl提供的三个类:

  • Workbook类用来创建工作簿、读取、创建,删除,复制工作表等。

  • load_workbook方法会读取已存在的工作簿,返回Workbook对象

  • Worksheet类用来进行表的操作,比如访问单元格。返回Cell对象。

使用Python操作Excel文档(一)的更多相关文章

  1. 用Python操作excel文档

    使用Python第三方库 这一节我们学习如何使用Python去操作Excel文档.如果大家有人不知道Excel的话,那么建议先学一学office办公基础.这里想要操作Excel,必须安装一个Pytho ...

  2. Python处理Excel文档(xlrd, xlwt, xlutils)

    简介 xlrd,xlwt和xlutils是用Python处理Excel文档(*.xls)的高效率工具.其中,xlrd只能读取xls,xlwt只能新建xls(不可以修改),xlutils能将xlrd.B ...

  3. 利用Python操作Word文档【图片】

    利用Python操作Word文档

  4. python操作docx文档(转)

    python操作docx文档 关于python操作docx格式文档,我用到了两个python包,一个便是python-docx包,另一个便是python-docx-template;,同时我也用到了很 ...

  5. $ 用python处理Excel文档(1)——用xlrd模块读取xls/xlsx文档

    本文主要介绍xlrd模块读取Excel文档的基本用法,并以一个GDP数据的文档为例来进行操作. 1. 准备工作: 1. 安装xlrd:pip install xlrd 2. 准备数据集:从网上找到的1 ...

  6. QTP操作excel文档

    对于QTP操作excel的大前提是,保证组建服务里的DCOM配置里存在 microsoft excel application ,具体的查看方式是,在运行框中输入dcomcnfg,然后会打开组件服务的 ...

  7. $用python处理Excel文档(2)——用xlsxwriter模块写xls/xlsx文档

    Refer:<python自动化运维:技术与最佳实践> 更多用法参考xlsxwriter官方文档:http://xlsxwriter.readthedocs.io/ 本文主要总结一下如何使 ...

  8. python 操作word文档

    因为工作需要操作一些word文档,记录一下学习思路 #-*- encoding: utf8 -*- import win32com from win32com.client import Dispat ...

  9. 利用xlrd模块实现Python读取Excel文档

    # -*- coding: cp936 -*- #python读取excel import xlrd def main(): xls=xlrd.open_workbook("d:\\11.x ...

随机推荐

  1. java lesson15Homework

    package lesson15; /** * 1. 使用ArrayList存储整型元素,并对元素进行升序输出 */ import java.util.ArrayList; import java.u ...

  2. 虚拟机centos7执行ip addr命令看不到ip地址

    转:https://blog.csdn.net/weixin_43343006/article/details/100094624 进入ect/sysconfig/network-scripts目录在 ...

  3. 适配方案(二)之PC端适配

    PC端 特点 PC端的屏幕具备以下特点: 屏幕大小一般是大于 13.3英寸 用户会经常拖拉浏览器的大小 原因 正是因为 PC端上的浏览器大小会经常被改变,而且改变的范围还很大,用户会全屏浏览器,用户也 ...

  4. JS基础_自增自减练习

    <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...

  5. JavaScript中变量声明效率问题

    1 var theString1 = "字符串1"; var theString2 = "字符串1"; var theString3 = "字符串1& ...

  6. Python单元测试框架unittest重要属性 与 用例编写思路

    前言 本文为转载,原文地址作者列举python unittest这个测试框架的主要属性和 测试用例思路 unittest单元测试框架不仅可以适用于单元测试,还可以适用WEB自动化测试用例的开发与执行, ...

  7. SpringBoot-整合Swagger2

    swagger2是一个用于生成.并能直接调用的可是话restful风格的服务 下面贴出springboot整合swagger2代码 一.maven依赖 这里使用的spring-boot版本是2.1.1 ...

  8. JavaScript【对象的学习】

    JavaScript对象的了解 1.js的String对象创建String对象:var str = "abc";方法和属性(参照W3C文档详细学习)属性 length:字符串的长度 ...

  9. Mysqldump备份问题

    1.1 Mysqldump文件数打开过多 mysql> mysqldump -uroot -p131400 --all-databases >/backup/mysql.sql mysql ...

  10. RHEL6使用系统自带多路径软件配置多路径

    1.多路径的主要功能 多路径一般配合存储设备实现如下功能: 故障的切换和恢复  IO流量的负载均衡  磁盘的虚拟化     2.查看系统自带的多路径软件是否安装 [root@cluster01 ~]# ...