Pandas | 25 文件读写

Pandas I/O API是一套像pd.read_csv()一样返回Pandas对象的顶级读取器函数。

读取文本文件(或平面文件)的两个主要功能是read_csv()和read_table()。它们都使用相同的解析代码来智能地将表格数据转换为DataFrame对象

pandas.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None)

形式2

pandas.read_csv(filepath_or_buffer, sep='\t', delimiter=None, header='infer', names=None, index_col=None, usecols=None)

以下是csv文件数据的内容 -

S.No,Name,Age,City,Salary

,Tom,,Toronto,

,Lee,,HongKong,

,Steven,,Bay Area,

,Ram,,Hyderabad,

将这些数据保存为temp.csv并对其进行操作。

S.No,Name,Age,City,Salary

,Tom,,Toronto,

,Lee,,HongKong,

,Steven,,Bay Area,

,Ram,,Hyderabad,

read.csv

read.csv从csv文件中读取数据并创建一个DataFrame对象。

import pandas as pd

df=pd.read_csv("temp.csv")

print (df)

输出结果：

   S.No    Name  Age       City  Salary

          Tom       Toronto

          Lee      HongKong

       Steven      Bay Area

          Ram     Hyderabad

自定义索引

可以指定csv文件中的一列来使用index_col定制索引。

import pandas as pd

df=pd.read_csv("temp.csv",index_col=['S.No'])

print (df)

输出结果：

        Name  Age       City  Salary

S.No

        Tom       Toronto

        Lee      HongKong

     Steven      Bay Area

        Ram     Hyderabad

转换器
dtype的列可以作为字典传递。

import pandas as pd

import numpy as np

df = pd.read_csv("temp.csv", dtype={'Salary': np.float64})

print (df.dtypes)

输出结果：

S.No        int64

Name       object

Age         int64

City       object

Salary    float64

dtype: object

默认情况下，Salary列的dtype是int，但结果显示为float，因为我们明确地转换了类型。

因此，数据看起来像浮点数 -

  S.No   Name   Age      City    Salary

0   1     Tom   28    Toronto   20000.0

1   2     Lee   32   HongKong    3000.0

2   3  Steven   43   Bay Area    8300.0

3   4     Ram   38  Hyderabad    3900.0

header_names
使用names参数指定标题的名称。

import pandas as pd

import numpy as np

df=pd.read_csv("temp.csv", names=['a', 'b', 'c','d','e'])

print (df)

输出结果：

      a       b    c          d       e

0  S.No    Name  Age       City  Salary

1     1     Tom   28    Toronto   20000

2     2     Lee   32   HongKong    3000

3     3  Steven   43   Bay Area    8300

4     4     Ram   38  Hyderabad    3900

观察可以看到，标题名称附加了自定义名称，但文件中的标题还没有被消除。现在，使用header参数来删除它。

如果标题不是第一行，则将行号传递给标题。这将跳过前面的行。

import pandas as pd

import numpy as np

df=pd.read_csv("temp.csv",names=['a','b','c','d','e'],header=0)

print (df)

输出结果：

   a       b   c          d      e

0  1     Tom  28    Toronto  20000

1  2     Lee  32   HongKong   3000

2  3  Steven  43   Bay Area   8300

3  4     Ram  38  Hyderabad   3900

skiprows

skiprows跳过指定的行数。参考以下示例代码 -

import pandas as pd

import numpy as np

df=pd.read_csv("temp.csv", skiprows=2)

print (df)

输出结果：

   2     Lee  32   HongKong  3000

0  3  Steven  43   Bay Area  8300

1  4     Ram  38  Hyderabad  3900

Pandas | 25 文件读写的更多相关文章

[Python]-pandas模块-CSV文件读写
Pandas 即Python Data Analysis Library,是为了解决数据分析而创建的第三方工具,它不仅提供了丰富的数据模型,而且支持多种文件格式处理,包括CSV.HDF5.HTML 等 ...
C++文件读写详解（ofstream,ifstream,fstream）
C++文件读写详解(ofstream,ifstream,fstream) 这里主要是讨论fstream的内容: #include <fstream> ofstream //文件写操作内存 ...
Python自动化--语言基础4--模块、文件读写、异常
模块1.什么是模块?可以理解为一个py文件其实就是一个模块.比如xiami.py就是一个模块,想引入使用就在代码里写import xiami即可2.模块首先从当前目录查询,如果没有再按path顺序逐一 ...
csv文件读写处理
csv文件读写处理 1.读取第一种: import csv with open("route.csv","r") as f: #reader是一个迭代 ...
Python之IO编程——文件读写、StringIO/BytesIO、操作文件和目录、序列化
IO编程 IO在计算机中指Input/Output,也就是输入和输出.由于程序和运行时数据是在内存中驻留,由CPU这个超快的计算核心来执行,涉及到数据交换的地方,通常是磁盘.网络等,就需要IO接口.从 ...
12--Python入门--文件读写--TXT文件
在进行数据分析之前,可能需要读写自己的数据文件.或者在完成数据分析之后,想把结果输出到外部的文件在Python中,利用pandas模块中的几个函数,可以轻松实现这些功能,利用pandas读取文件之后数 ...
Python文件读写及网站显示
一.关于文件读写的笔记 (一) 文件概述文件是一个存储在辅助存储器上的数据序列,可以包含任何数据内容文件都是按照2进制进行存储的,但在表现形式上有2种:文本文件和二进制文件. 1. 文本文件文本 ...
Android 数据存储02之文件读写
Android文件读写版本修改内容日期修改人 V1.0 原始版本 2013/2/25 skywang Android文件读写的有两种方式.一种,是通过标准的JavaIO库去读写.另一种,是通过 ...
C++文件读写函数之——fopen、fread和fwrite、fgetc和fputc、fgets和fputs、ftellf和fseek、rewind
由于最近经常使用到c语言中的读写文件,所以在此总结以下,方便以后查找. 在c中,文件操作都是由库函数来实现的,主要是分为读和写两种操作,以下详细讲解以下所有有关文件操作的邯郸乎的用法: //C++写入 ...

随机推荐

pg_sql常用查询语句整理
#pg_sql之增删改查 #修改: inset into table_name (id, name, age, address ) select replace(old_id,old_id,new_i ...
Ceph更换OSD磁盘
目录简介更换OSD操作步骤 1. 故障磁盘定位 2. 摘除故障磁盘 3. 重建raid0 4. 重建osd 控制数据恢复及回填速度简介首先需要说明的是,ceph的osd是不建议做成raid10 ...
ISO C语言新标准(C11)
新特性[2]有些和C++11是对应的,如线程和UTF-8: 对齐处理(Alignment)的标准化(包括_Alignas标志符,alignof运算符, aligned_alloc函数以及<std ...
单点登录（sso）入门
单点登录的英文名叫做Single Sign On,简称SSO. 在以前,一般我们就单系统,所有的功能都在同一个系统上. 后来,我们为了合理利用资源和降低耦合性,于是把单系统拆分成多个子系统. 比如阿里 ...
Linux内核调优部分参数说明
#接收套接字缓冲区大小的默认值(以字节为单位). net.core.rmem_default = 262144 #接收套接字缓冲区大小的最大值(以字节为单位). net.core.rmem_max = ...
golang 学习笔记 ---new()和 make()的区别详解
概述 Go 语言中的 new 和 make 一直是新手比较容易混淆的东西,咋一看很相似.不过解释两者之间的不同也非常容易. new 的主要特性首先 new 是内建函数,你可以从 http://gol ...
.net Core 学习笔记(增加Nlog日志)
https://github.com/NLog/NLog.Web/wiki/Getting-started-with-ASP.NET-Core-2 (日志下载) https://github.com ...
Linux 笔记 - 第二十二章 Nginx 配置 SSL
一.前言基础知识 1.1 公钥密码体制(public-key cryptography) 公钥密码体制分为三个部分,公钥.私钥.加密解密算法,它的加密解密过程如下: 加密:通过加密算法和公钥对内容( ...
.NET设计模式-观察者模式
Observer(观察者模式) 定义对象间的一种一对多的依赖关系,以便当一个对象的状态发生改变时,所有依赖于它的对象都得到通知并自动刷新. 说白了就是事件. using System; namespa ...
.Net MVC伪静态实现
伪静态的好处就不多说了这里说一下Mvc具体实现的方法第一步打开根目录的Web.config 给webServer 节点下的modules 添加属性runAllManagedModulesFo ...

Pandas | 25 文件读写

read.csv

Pandas | 25 文件读写的更多相关文章

随机推荐

热门专题