pandas读取Excel文件

In [7]:

import pandas as pd

filname = 'ch02数据导入\\student.xlsx'

data = pd.read_excel(filname)

data

Out[7]:

	姓名	年龄	爱好	学号	学费
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000
3	赵六	25	下棋	15	500
4	王七	20	跑步	16	60
5	朱八	28	旅游	17	300

In [9]:

# 打印前3行数据

data.head(3)

Out[9]:

	姓名	年龄	爱好	学号	学费
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000

In [10]:

# 打印[1-3)行数据

data[1:3]

Out[10]:

	姓名	年龄	爱好	学号	学费
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000

In [11]:

# 根据列名，打印某一列数据

data['姓名']

Out[11]:

0    张三

1    李四

2    周五

3    赵六

4    王七

5    朱八

Name: 姓名, dtype: object

In [12]:

# 查看所有字段

field = data.columns.tolist()

field

Out[12]:

['姓名', '年龄', '爱好', '学号', '学费']

In [13]:

# 只显示第四行

data.loc[4]

Out[13]:

姓名    王七

年龄    20

爱好    跑步

学号    16

学费    60

Name: 4, dtype: object

In [15]:

# 打印多个列数据，需要双层[[]]

data[["姓名", "年龄"]]

Out[15]:

	姓名	年龄
0	张三	20
1	李四	21
2	周五	23
3	赵六	25
4	王七	20
5	朱八	28

In [16]:

# 查看基础数据

# mean = 均值

# std = 方差

data.describe()  # 只针对数值型

Out[16]:

	年龄	学号	学费
count	6.000000	6.000000	6.000000
mean	22.833333	14.500000	3143.333333
std	3.188521	1.870829	3195.632436
min	20.000000	12.000000	60.000000
25%	20.250000	13.250000	350.000000
50%	22.000000	14.500000	2750.000000
75%	24.500000	15.750000	5750.000000
max	28.000000	17.000000	7000.000000

In [17]:

data2 = pd.read_excel(filname,header=None)

data2

Out[17]:

	0	1	2	3	4
0	姓名	年龄	爱好	学号	学费
1	张三	20	打球	12	5000
2	李四	21	游泳	13	6000
3	周五	23	唱歌	14	7000
4	赵六	25	下棋	15	500
5	王七	20	跑步	16	60
6	朱八	28	旅游	17	300

In [18]:

data2.values

Out[18]:

array([['姓名', '年龄', '爱好', '学号', '学费'],

       ['张三', 20, '打球', 12, 5000],

       ['李四', 21, '游泳', 13, 6000],

       ['周五', 23, '唱歌', 14, 7000],

       ['赵六', 25, '下棋', 15, 500],

       ['王七', 20, '跑步', 16, 60],

       ['朱八', 28, '旅游', 17, 300]], dtype=object)

In [21]:

data.values

Out[21]:

array([['张三', 20, '打球', 12, 5000],

       ['李四', 21, '游泳', 13, 6000],

       ['周五', 23, '唱歌', 14, 7000],

       ['赵六', 25, '下棋', 15, 500],

       ['王七', 20, '跑步', 16, 60],

       ['朱八', 28, '旅游', 17, 300]], dtype=object)

In [22]:

data.index

Out[22]:

RangeIndex(start=0, stop=6, step=1)

pandas参数说明

pandas.read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, usecols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, converters=None, dtype=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds)

1.io ：excel 路径；

In [24]:

data3 = pd.read_excel(io=filname)

data3

Out[24]:

	姓名	年龄	爱好	学号	学费
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000
3	赵六	25	下棋	15	500
4	王七	20	跑步	16	60
5	朱八	28	旅游	17	300

2.sheetname：默认是sheetname为0，返回多表使用sheetname=[0,1]，若sheetname=None是返回全表。注意：int/string返回的是dataframe，而none和list返回的是dict of dataframe。

In [32]:

data3 = pd.read_excel(filname,sheet_name=[0,1])

data3

Out[32]:

OrderedDict([(0,    姓名  年龄  爱好  学号    学费

              0  张三  20  打球  12  5000

              1  李四  21  游泳  13  6000

              2  周五  23  唱歌  14  7000

              3  赵六  25  下棋  15   500

              4  王七  20  跑步  16    60

              5  朱八  28  旅游  17   300), (1,   动物    植物

              0    小猫  花

              1    小狗  树)])

In [37]:

data3 = pd.read_excel(filname,sheet_name=0)

data3

Out[37]:

	姓名	年龄	爱好	学号	学费
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000
3	赵六	25	下棋	15	500
4	王七	20	跑步	16	60
5	朱八	28	旅游	17	300

In [38]:

data3 = pd.read_excel(filname,sheet_name=1)

data3

Out[38]:

	动物	植物
0	小猫	花
1	小狗	树

3.header ：指定作为列名的行，默认0，即取第一行，数据为列名行以下的数据；若数据不含列名，则设定 header = None；

In [39]:

data3 = pd.read_excel(filname,sheet_name=0,header=None)

data3

Out[39]:

	0	1	2	3	4
0	姓名	年龄	爱好	学号	学费
1	张三	20	打球	12	5000
2	李四	21	游泳	13	6000
3	周五	23	唱歌	14	7000
4	赵六	25	下棋	15	500
5	王七	20	跑步	16	60
6	朱八	28	旅游	17	300

In [40]:

data3 = pd.read_excel(filname,sheet_name=0,header=2)

data3

Out[40]:

	李四	21	游泳	13	6000
0	周五	23	唱歌	14	7000
1	赵六	25	下棋	15	500
2	王七	20	跑步	16	60
3	朱八	28	旅游	17	300

4.skiprows：省略指定行数的数据

In [42]:

data3 = pd.read_excel(filname, sheet_name=0, skiprows=1)

data3

Out[42]:

	张三	20	打球	12	5000
0	李四	21	游泳	13	6000
1	周五	23	唱歌	14	7000
2	赵六	25	下棋	15	500
3	王七	20	跑步	16	60
4	朱八	28	旅游	17	300

5.skipfooter：省略从尾部数的行数据

In [44]:

data3 = pd.read_excel(filname, sheet_name=0, skipfooter=1)

data3

Out[44]:

	姓名	年龄	爱好	学号	学费
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000
3	赵六	25	下棋	15	500
4	王七	20	跑步	16	60

6.index_col ：指定列为索引列，也可以使用 u’string’

In [46]:

data3 = pd.read_excel(filname, sheet_name=0, index_col=1)

data3

Out[46]:

	姓名	爱好	学号	学费
年龄
20	张三	打球	12	5000
21	李四	游泳	13	6000
23	周五	唱歌	14	7000
25	赵六	下棋	15	500
20	王七	跑步	16	60
28	朱八	旅游	17	300

7.names：指定列的名字，传入一个list数据

In [49]:

data3 = pd.read_excel(filname, sheet_name=0,

                      names=['a', 'b', 'c', 'd', 'e'])

data3

Out[49]:

	a	b	c	d	e
0	张三	20	打球	12	5000
1	李四	21	游泳	13	6000
2	周五	23	唱歌	14	7000
3	赵六	25	下棋	15	500
4	王七	20	跑步	16	60
5	朱八	28	旅游	17	300

pandas读取Excel文件的更多相关文章

用python的pandas读取excel文件中的数据
一.读取Excel文件使用pandas的read_excel()方法,可通过文件路径直接读取.注意到,在一个excel文件中有多个sheet,因此,对excel文件的读取实际上是读取指定文件.并 ...
pandas 读取excel文件对数据简单清洗并用matplotlib 将数据展示
首先我们看下数据接下来数据分析操作 import numpy as np import pandas as pd from matplotlib import pyplot as plt if __ ...
深入理解pandas读取excel,txt,csv文件等命令
pandas读取文件官方提供的文档在使用pandas读取文件之前,必备的内容,必然属于官方文档,官方文档查阅地址 http://pandas.pydata.org/pandas-docs/versi ...
机器学习之数据预处理，Pandas读取excel数据
Python读写excel的工具库很多,比如最耳熟能详的xlrd.xlwt,xlutils,openpyxl等.其中xlrd和xlwt库通常配合使用,一个用于读,一个用于写excel.xlutils结 ...
pandas read excel文件碰到的一个小问题
今天利用pandas读取excel时,爆出如下错误: 代码为: import pandas as pd db_eua=pd.read_excel('db_eua.xlsx',sheetname='EU ...
用pandas读取excel报错
用pandas.read_execl()方法读取excel文件报错. 后来导入xlrd第三方库,就好了.
Python 使用Pandas读取Excel的学习笔记
这里介绍Python中使用Pandas读取Excel的方法一.软件环境: OS:Win7 64位 Python 3.7 二.文件准备 1.项目结构: 2.在当前实验文件夹下建立一个Source文件夹 ...
pandas处理excel文件和csv文件
一.csv文件 csv以纯文本形式存储表格数据 pd.read_csv('文件名'),可添加参数engine='python',encoding='gbk' 一般来说,windows系统的默认编码为g ...
C# 读取EXCEL文件的三种经典方法
1.方法一:采用OleDB读取EXCEL文件: 把EXCEL文件当做一个数据源来进行数据的读取操作,实例如下: public DataSet ExcelToDS(string Path) { stri ...

随机推荐

理解BFC以及BFC相关布局问题解决
写页面时会遇到: 子元素float父元素的高度不会撑开; 在布局时,box1and box2,其中box1 float:left,这是box2会在box1下面,(如果文字过多就会形成文字环绕效果),但 ...
Canvas 实现钟表
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
Go Int转string几种方式性能测试
Go Int转string几种方式性能测试 - 贤冰的博客 - CSDN博客 https://blog.csdn.net/flyfreelyit/article/details/79701577
Spring 缓存切面
缓存切面:[通知+目标方法调用] 缓存操作执行过程: 1)如果是同步调用[sync=true],则首先尝试从缓存中读取数据,读取到则直接返回: 否则执行目标方法,将结果缓存后返回. 2)如果不是同步调 ...
阶段3 1.Mybatis_06.使用Mybatis完成DAO层的开发_8 properties标签的使用及细节
properties 可以把数据库链接的配置放在上面的properties里面 #{占位符}的形式去引用上面的.下面的内容就是引用上面的内容的定义. 运行查询的方法测试一下这样改造可以成功的运行程序 ...
HTML5——新表单元素表单属性语义元素
表单元素新的表单元素 datalist——输入域选项列表 keygen——提供一种验证用户的可靠方法 output——不同类型的输出,比如计算或脚本输出表单属性 <form> / &l ...
【ABAP系列】SAP ABAP 的替代和校验
公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[ABAP系列]SAP ABAP 的替代和校验 ...
database 学习
ref : 什么是NoSQL,为什么要使用NoSQL?
【组策略】1.组策略介绍group policy
组策略介绍group policy 高效学习法,念念不忘,必有回响. 分享一个高效学习思维,潜意识思考.就是在您没有大量时间的情况下,学习十分钟. 然后离开去完成别的事情的时候,大脑潜意识中还会继续思 ...
安卓手机上传同一张图片第二次不触发onchange
清空上一次file内部的值 <script type="text/javascript"> var file = document.getElementById(&q ...

pandas读取Excel文件

pandas参数说明

pandas读取Excel文件的更多相关文章

随机推荐

热门专题