一、函数原型

pd.read_excel(io, sheet_name=0, header=0,

	names=None, index_col=None,

	usecols=None, squeeze=False,

	dtype=None, engine=None,

	converters=None, true_values=None,

	false_values=None, skiprows=None,

	nrows=None, na_values=None,

	parse_dates=False, date_parser=None,

	thousands=None, comment=None,

	skipfooter=0, convert_float=True, **kwds)

二、功能说明

将Excel文件读取到pandas DataFrame中，支持本地文件系统或URL的’xls’和’xlsx’文件扩展名，带有这两种扩展名的文件，函数都可以处理。

三、常用参数说明

io参数

io参数可以接受的有：str，Excel文件，xlrd.Book，路径对象或类似文件的对象。其中最常用的是str，一般是文件路径+文件名，需要注意的是文件名字不要漏掉后缀，即文件扩展名，表明文件类型的那个！有时候需要对路径中的”\”进行转义，io参数没有默认值，必须传入。

# jupter notebook环境中不需要对"\"进行转义

pd.read_excel(r"C:\Users\asus\Desktop\test.xlsx")

# pd.read_excel(r"C:\\Users\\asus\\Desktop\\test.xlsx")

# jupter notebook、Windows环境下，用"/"可以文件名联想

pd.read_excel(r"C:/Users/asus/Desktop/test.xlsx")

tips：要不要转义可能和编辑器、操作系统有关。建议都写成最后一种形式。

sheet_name参数

通过sheet位置或sheet名字来指定读入哪个sheet的数据。

当一个excel工作簿中包含有很多个sheet工作表时，sheet_name用于决定导入那个sheet表单。可以接收的参数类型有：str，int，list或None，默认0。其中，str代表“工作表名称”；整数用于零索引工作表位置；字符串/整数列表用于请求多个工作表；None获取所有工作表；默认0，获取第一个工作表。

# 导入第一个工作表，索引从0开始，传参类型为int

pd.read_excel(r"C://Users//asus//Desktop/test.xlsx",sheet_name=0)

# 导入表名为“data1”的工作表，传参类型为str

pd.read_excel(r"C://Users//asus//Desktop/test.xlsx",sheet_name="data1")

# 导入第一个和第三个工作表，传参类型为int型列表

pd.read_excel(r"C://Users//asus//Desktop/test.xlsx",sheet_name=[0,2])

header参数

指定哪一行作为列名的，默认值是0，即第1行作为列名。

接受的参数可以是：整数（指定第几行作为列名）；有整数组成的列表（指定哪几行作为列名）；None（没有列名，Python自动生成0始序列）

# 列名为从0开始的序列

pd.read_excel(r"C://Users//asus//Desktop/test.xlsx",header=None)

# 第3行当列名

pd.read_excel(r"C://Users//asus//Desktop/test.xlsx",header=2)

# 第3，5行当列名

pd.read_excel(r"C://Users//asus//Desktop/test.xlsx",header=[2,4])

names参数

表示要使用的列名列表,也就是说可以自定义列名。一般传入字符型列表。默认是None。

若设置了names参数，同时也设置了header参数，此时header=n表示从第n+2行开始导入数据。

header = None和names参数都设置的话，依然会显示names指定的列名，从第一行开始导入数据。

# 从第2行开始导入数据

pd.read_excel(r"C:/Users/asus/Desktop/test.xlsx",header=0,names=["a","b","c"])

# 从第1行开始导入数据

pd.read_excel(r"C:/Users/asus/Desktop/test.xlsx",header=None,names=["a","b","c"])

index_col参数

指定用哪一列做为索引。参数接收整数，或者由整数组成的列表，默认是None。和header参数类似。

usecols参数

控制导入的哪几列（当列数过多时）。接收整数（列的位置），字符（列名称）或者类似列表的序列。如果设置了names参数，注意设置的列名个数要和读取的列数一致。

squeeze参数

接收布尔值，当取值为True的时候，如果解析的数据仅包含一列，则返回Series。默认值是False，即只有一列也返回Dataframe。

dtype参数

输入表示数据类型的名称字符或者字典，如果输入的是字符表示整个表格的数据都转换成指定的数据类型，如果输入的是字典，那么每个字段可以指定不同的数据类型。

假如整个表格中既有文本又有数值，如果要设置成统一的数据类型只能设置成字符型。

返回值：DataFrame数据框对象或Series对象（squeeze参数控制）

四、总结

参数能控制啥？哪1个或几个表（假若是多表）、哪几行或几列、数据重哪行开始导入、列名和行索引等等

pandas（1）：Pandas文件读取——read_excel()的更多相关文章

pandas read excel文件碰到的一个小问题
今天利用pandas读取excel时,爆出如下错误: 代码为: import pandas as pd db_eua=pd.read_excel('db_eua.xlsx',sheetname='EU ...
【繁琐工作自动化】pandas 处理 excel 文件
0. 一般处理读取 excel 格式文件:df = pd.read_excel('xx.xlsx'),下面是一些简单查看文件内容的函数: df.head():展示前五行: df.columns:展示 ...
Python使用xlrd、pandas包从Excel读取数据
#coding=utf-8 # pip install xlrd import xlrd def read_from_xls(filepath,index_col_list): #filepath:读 ...
pandas处理excel文件和csv文件
一.csv文件 csv以纯文本形式存储表格数据 pd.read_csv('文件名'),可添加参数engine='python',encoding='gbk' 一般来说,windows系统的默认编码为g ...
（数据科学学习手札63）利用pandas读写HDF5文件
一.简介 HDF5(Hierarchical Data Formal)是用于存储大规模数值数据的较为理想的存储格式,文件后缀名为h5,存储读取速度非常快,且可在文件内部按照明确的层次存储数据,同一个H ...
其它课程中的python---5、Pandas处理数据和读取数据
其它课程中的python---5.Pandas处理数据和读取数据一.总结一句话总结: 记常用和特例:慢慢慢慢的就熟了,不用太着急,慢慢来库的使用都很简单:就是库的常用函数就这几个,后面用的时候学 ...
[Python]-pandas模块-CSV文件读写
Pandas 即Python Data Analysis Library,是为了解决数据分析而创建的第三方工具,它不仅提供了丰富的数据模型,而且支持多种文件格式处理,包括CSV.HDF5.HTML 等 ...
[Pandas]利用Pandas处理excel数据
Python 处理excel的第三包有很多,比如XlsxWriter.xlrd&xlwt.OpenPyXL.Microsoft Excel API等,最后综合考虑选用了Pandas. Pand ...
Pandas之:Pandas高级教程以铁达尼号真实数据为例
Pandas之:Pandas高级教程以铁达尼号真实数据为例目录简介读写文件 DF的选择选择列数据选择行数据同时选择行和列使用plots作图使用现有的列创建新的列进行统计 DF重组简 ...

随机推荐

E百科 | 基于MEC的边缘AI服务
简介: 阿里云边缘计算团队付哲解读5G下热门场景:边缘AI.作者:阿里云付哲,计算机科学与技术专业博士后,在流量检测.资源调度领域有深入研究,其论文<Astraea: Deploy AI Ser ...
pwn篇：攻防世界进阶welpwn，LibcSearcher使用
攻防世界welpwn (搬运一篇自己在CSDN写的帖子) 链接:https://blog.csdn.net/weixin_44644249/article/details/113781356 这题主要 ...
使用gitlab构建基于docker的持续集成（一）
使用gitlab构建基于docker的持续集成(一) gitlab docker aspnetcore 持续集成开篇整体环境规划准备工作 CA证书虚拟机系统:安装Centos7.3 3.设置C ...
SpringBoot(二): SpringBoot属性配置文件 SpringBoot多环境配置文件 SpringBoot自定义配置文件
1.属性配置文件一共分为两种,一种是键值对的properties属性配置文件,一种是yaml格式的配置文件 properties配置: 2.多环境配置文件当我们的项目中有多套配置文件比如开发的配 ...
JavaScript 模拟 sleep
用 JS 实现沉睡几秒后再执行,有好几种方式,但都不完美,以下是我感觉比较好的一种方式 function sleep(time) { return new Promise((resolve) => ...
Power BI成功的背后
Power BI成功的背后魔力象限又是一年Gartner数据分析与BI魔力象限报告的发布,Power BI毫无悬念的第一,并且拉开与其他产品的差距越来越大.在Power BI dataflows( ...
【Azure Redis 缓存】Azure Redis 功能性讨论二
继承上一次讨论了Azure Redis的可用性,可靠性,稳定性,安全性,监控方面的九大功能点.详情可回顾文章:[Azure Redis 缓存]Azure Redis功能性讨论这次我们继续讨论Azur ...
pytorch（03）tensor的操作
张量操作一.张量的拼接 torch.cat() 功能:将张量按维度dim进行拼接,且[不会扩张张量的维度] tensors:张量序列 dim:要拼接的维度 torch.cat(tensors, di ...
C#类中的成员
@ 目录字段属性方法构造函数类和对象的简单解释创建类和对象类中成员的归属问题字段字段的声明与声明变量类似,可以添加访问修饰符,通常情况下字段设置为私有的,然后定义属性对字段的读写进行 ...
AtCoder Beginner Contest 171-175 F
171 F - Strivore 直接把初始字符当成隔板,统计的方案数会有重复为了避免重复情况,规定隔板字母尽可能最后出现,即在隔板字母后面不能插入含隔板字母的字符串所以在隔板字母后插入的字符只有 ...