`numpy`中csv文件的存储和读取

CSV文件：(Comma‐Separated Value, 逗号分隔值)

一维和二维数组

存储

np.savetxt(frame,array,fmt='%.18e',delimiter=None,newline='\n', header='', footer='', comments='# ', encoding=None)

frame : 文件、字符串或产生器，可以是.gz或.bz2的压缩文件。
array : 存入文件的数组（一维或者二维）。
fmt：写入文件的格式，例如： %d %.2f %.18e 。
delimiter : 分割字符串，默认是任何空格。

其他参数看文档。

import numpy as np

a = np.arange(100).reshape((5,20))

np.savetxt('a.csv',a,fmt = '%d',delimiter=',')

b = np.loadtxt('a.csv',delimiter=',')

b

array([[ 0.,  1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10., 11., 12.,

        13., 14., 15., 16., 17., 18., 19.],

       [20., 21., 22., 23., 24., 25., 26., 27., 28., 29., 30., 31., 32.,

        33., 34., 35., 36., 37., 38., 39.],

       [40., 41., 42., 43., 44., 45., 46., 47., 48., 49., 50., 51., 52.,

        53., 54., 55., 56., 57., 58., 59.],

       [60., 61., 62., 63., 64., 65., 66., 67., 68., 69., 70., 71., 72.,

        73., 74., 75., 76., 77., 78., 79.],

       [80., 81., 82., 83., 84., 85., 86., 87., 88., 89., 90., 91., 92.,

        93., 94., 95., 96., 97., 98., 99.]])

读取

np.loadtxt(fname, dtype=<type 'float'>, comments='#', delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0, encoding='bytes')

frame : 文件、字符串或产生器，可以是.gz或.bz2的压缩文件。
dtype : 数据类型，可选。
delimiter : 分割字符串，默认是任何空格。
usecols：选取数据的列。
unpack : 如果True，读入属性将分别写入不同变量。

其他看文档。

注意：usecols，如果选取前三列，应该是usecols=(0,1,2)，如果只选取第三列，应该是usecols=(2,)。但是，我尝试了一下，不输入逗号也可以，usecols=(2)。

b = np.loadtxt('a.csv',dtype = np.int,delimiter=',',usecols=(0,1,2))

b

array([[ 0,  1,  2],

       [20, 21, 22],

       [40, 41, 42],

       [60, 61, 62],

       [80, 81, 82]])

b = np.loadtxt('a.csv',dtype = np.int,delimiter=',',usecols=(2,))

b

array([ 2, 22, 42, 62, 82])

b = np.loadtxt('a.csv',dtype = np.int,delimiter=',',usecols=(2))

b

array([ 2, 22, 42, 62, 82])

需要注意的是CSV文件只能有效存储一维和二维数组。

np.savetxt() np.loadtxt()只能有效存取一维和二维数组。

多维数组（任意维度）

存储

a.tofile(frame, sep='', format='%s')

frame : 文件、字符串
sep : 数据分割字符串，如果是空串，写入文件为二进制。即，默认为空串。
format : 写入数据的格式

import numpy as np

a = np.arange(100).reshape((5,10,2))

a

Out[3]:

array([[[ 0,  1],

        [ 2,  3],

        [ 4,  5],

        [ 6,  7],

        [ 8,  9],

        [10, 11],

        [12, 13],

        [14, 15],

        [16, 17],

        [18, 19]],

       [[20, 21],

        [22, 23],

        [24, 25],

        [26, 27],

        [28, 29],

        [30, 31],

        [32, 33],

        [34, 35],

        [36, 37],

        [38, 39]],

       [[40, 41],

        [42, 43],

        [44, 45],

        [46, 47],

        [48, 49],

        [50, 51],

        [52, 53],

        [54, 55],

        [56, 57],

        [58, 59]],

       [[60, 61],

        [62, 63],

        [64, 65],

        [66, 67],

        [68, 69],

        [70, 71],

        [72, 73],

        [74, 75],

        [76, 77],

        [78, 79]],

       [[80, 81],

        [82, 83],

        [84, 85],

        [86, 87],

        [88, 89],

        [90, 91],

        [92, 93],

        [94, 95],

        [96, 97],

        [98, 99]]])

a.tofile('b.dat',sep=',',format='%d')

读取

np.fromfile(frame, dtype=float, count=‐1, sep='')

frame : 文件、字符串
dtype : 读取的数据类型。可以发现，我们读取数据的时候都需要指定数据类型，无论是不是一维二维。默认为浮点型
count : 读入元素个数， ‐1表示读入整个文件
sep : 数据分割字符串，如果是空串，写入文件为二进制

c = np.fromfile('b.dat',dtype=np.int,sep=',')

c

Out[6]:

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,

       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,

       34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50,

       51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67,

       68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84,

       85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99])

可以发现，读取到的数据维度信息丢失了。因此，我们需要将维度信息告诉c。

c = np.fromfile('b.dat',dtype=np.int,sep=',').reshape((5,10,2))

c

Out[14]:

array([[[ 0,  1],

        [ 2,  3],

        [ 4,  5],

        [ 6,  7],

        [ 8,  9],

        [10, 11],

        [12, 13],

        [14, 15],

        [16, 17],

        [18, 19]],

       [[20, 21],

        [22, 23],

        [24, 25],

        [26, 27],

        [28, 29],

        [30, 31],

        [32, 33],

        [34, 35],

        [36, 37],

        [38, 39]],

       [[40, 41],

        [42, 43],

        [44, 45],

        [46, 47],

        [48, 49],

        [50, 51],

        [52, 53],

        [54, 55],

        [56, 57],

        [58, 59]],

       [[60, 61],

        [62, 63],

        [64, 65],

        [66, 67],

        [68, 69],

        [70, 71],

        [72, 73],

        [74, 75],

        [76, 77],

        [78, 79]],

       [[80, 81],

        [82, 83],

        [84, 85],

        [86, 87],

        [88, 89],

        [90, 91],

        [92, 93],

        [94, 95],

        [96, 97],

        [98, 99]]])

如果我们不指定分隔符，则读取也不需要指定，此时存储的是二进制文件。

a = np.arange(100).reshape((5,10,2))

a

Out[18]:

array([[[ 0,  1],

        [ 2,  3],

        [ 4,  5],

        [ 6,  7],

        [ 8,  9],

        [10, 11],

        [12, 13],

        [14, 15],

        [16, 17],

        [18, 19]],

       [[20, 21],

        [22, 23],

        [24, 25],

        [26, 27],

        [28, 29],

        [30, 31],

        [32, 33],

        [34, 35],

        [36, 37],

        [38, 39]],

       [[40, 41],

        [42, 43],

        [44, 45],

        [46, 47],

        [48, 49],

        [50, 51],

        [52, 53],

        [54, 55],

        [56, 57],

        [58, 59]],

       [[60, 61],

        [62, 63],

        [64, 65],

        [66, 67],

        [68, 69],

        [70, 71],

        [72, 73],

        [74, 75],

        [76, 77],

        [78, 79]],

       [[80, 81],

        [82, 83],

        [84, 85],

        [86, 87],

        [88, 89],

        [90, 91],

        [92, 93],

        [94, 95],

        [96, 97],

        [98, 99]]])

a.tofile('b.dat',format='%d')

c = np.fromfile('b.dat',dtype=np.int).reshape((5,10,2))

c

Out[21]:

array([[[ 0,  1],

        [ 2,  3],

        [ 4,  5],

        [ 6,  7],

        [ 8,  9],

        [10, 11],

        [12, 13],

        [14, 15],

        [16, 17],

        [18, 19]],

       [[20, 21],

        [22, 23],

        [24, 25],

        [26, 27],

        [28, 29],

        [30, 31],

        [32, 33],

        [34, 35],

        [36, 37],

        [38, 39]],

       [[40, 41],

        [42, 43],

        [44, 45],

        [46, 47],

        [48, 49],

        [50, 51],

        [52, 53],

        [54, 55],

        [56, 57],

        [58, 59]],

       [[60, 61],

        [62, 63],

        [64, 65],

        [66, 67],

        [68, 69],

        [70, 71],

        [72, 73],

        [74, 75],

        [76, 77],

        [78, 79]],

       [[80, 81],

        [82, 83],

        [84, 85],

        [86, 87],

        [88, 89],

        [90, 91],

        [92, 93],

        [94, 95],

        [96, 97],

        [98, 99]]])

需要注意

该方法需要读取时知道存入文件时数组的维度和元素类型
a.tofile()和np.fromfile()需要配合使用
可以通过元数据文件来存储额外信息

Numpy文件的便捷存取

np.save(fname, array) 或 np.savez(fname, array)

fname : 文件名，以.npy为扩展名，压缩扩展名为.npz
array : 数组变量

np.load(fname)

fname : 文件名，以.npy为扩展名，压缩扩展名为.npz

a = np.arange(100).reshape(5, 10, 2)

np.save('a.npy',a)

b = np.load('a.npy)

            b = np.load('a.npy')

b

Out[26]:

array([[[ 0,  1],

        [ 2,  3],

        [ 4,  5],

        [ 6,  7],

        [ 8,  9],

        [10, 11],

        [12, 13],

        [14, 15],

        [16, 17],

        [18, 19]],

       [[20, 21],

        [22, 23],

        [24, 25],

        [26, 27],

        [28, 29],

        [30, 31],

        [32, 33],

        [34, 35],

        [36, 37],

        [38, 39]],

       [[40, 41],

        [42, 43],

        [44, 45],

        [46, 47],

        [48, 49],

        [50, 51],

        [52, 53],

        [54, 55],

        [56, 57],

        [58, 59]],

       [[60, 61],

        [62, 63],

        [64, 65],

        [66, 67],

        [68, 69],

        [70, 71],

        [72, 73],

        [74, 75],

        [76, 77],

        [78, 79]],

       [[80, 81],

        [82, 83],

        [84, 85],

        [86, 87],

        [88, 89],

        [90, 91],

        [92, 93],

        [94, 95],

        [96, 97],

        [98, 99]]])

这里的存储，实际上也是二进制文件，如果只在python中进行操作，这种方法很方便，如果需要与其他程序进行交互，则需要视情况存储为CSV文件等。

numpy中文件的存储和读取-嵩天老师笔记的更多相关文章

复杂dic的文件化存储和读取问题
今天遇到一个难题.整出一个复杂的dic,里面不仅维度多,还含有numpy.array.超级复杂.过程中希望能够存储一下,万一服务器停了呢?万一断电了呢? 结果存好存,取出来可就不是那样了.网上搜索了很 ...
android IO流操作文件（存储和读取）
存储文件: public class FileOperate extends Activity { private static final String FILENAME = "mydat ...
iOS NSMutableDictionary中UIImage的存储和读取
思路:将UIImage转换成NSData,然后插入到NSMutableDictionary中.读取时,用NSData读出来,然后再转换成UIImage -存储 UIImage *image = [se ...
Numpy用于数组数据的存储和读取
Python的Numpy模块可用于存储和读取数据: 1.将一个数组存储为二进制文件 Numpy.save:将一个数组以.npy的格式保存为二进制文件调用格式:numpy.save(file, arr ...
[转] C#实现在Sql Server中存储和读取Word文件（Not Correct Modified）
出处 C#实现在Sql Server中存储和读取Word文件要实现在Sql Server中实现将文件读写Word文件,需要在要存取的表中添加Image类型的列,示例表结构为: CREATE TABL ...
在IOS中使用DES算法对Sqlite数据库进行内容加密存储并读取解密
在IOS中使用DES算法对Sqlite 数据库进行内容加密存储并读取解密涉及知识点: 1.DES加密算法: 2.OC对Sqlite数据库的读写: 3.IOS APP文件存储的两种方式及读取方式. 以 ...
Android中的数据存储（二）：文件存储 2017-05-25 08:16 35人阅读评论(0) 收藏
文件存储这是本人(菜鸟)学习android数据存储时接触的有关文件存储的知识以及本人自己写的简单地demo,为初学者学习和使用文件存储提供一些帮助.. 如果有需要查看SharedPreference ...
numpy的文件存储.npy .npz 文件详解
Numpy能够读写磁盘上的文本数据或二进制数据. 将数组以二进制格式保存到磁盘 np.load和np.save是读写磁盘数组数据的两个主要函数,默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为 ...
.Net下二进制形式的文件存储与读取
.Net下图片的常见存储与读取凡是有以下几种:存储图片:以二进制的形式存储图片时,要把数据库中的字段设置为Image数据类型(SQL Server),存储的数据是Byte[].1.参数是图片路径:返回 ...

随机推荐

LabVIEW之生产者/消费者模式
LabVIEW之生产者/消费者设计模式彭会锋
net.paoding.analysis.exception.PaodingAnalysisException: dic home should not be a file, but a directory!
Caused by: net.paoding.analysis.exception.PaodingAnalysisException: dic home should not be a file, b ...
day21 git & github + Celery 分布式任务队列
参考博客: git & github 快速入门http://www.cnblogs.com/alex3714/articles/5930846.html git@github.com:liyo ...
更改gitlab默认端口
若linux服务器的80和8080端口都已经被使用,则需修改gitlab监听的端口修改路径文件:vim /etc/gitlab/gitlab.rb 1.修改external_url 'http:// ...
poj2400
题解: 最少平均分值是等于最佳匹配的权值和除上一个总的点数2*n 注意输入反过来代码: #include<cstdio> #include<cstring> #include ...
决定整理一下canvas的基础学习
好久没有用过canvas,都要忘完了.还是决定复习一下以前的笔记,以及整理一下笔记,以后好查阅
《gradle 用户指南中文版》第1章、简介
第1章.简介目录 1.1 关于本用户指南 Gradle是一个基于Apache Ant和Apache Maven概念的项目自动化构建工具. 这里我们将介绍Gradle,我们认为gradle让java项 ...
Openlayers3中实现地图的切割
概述: 本文讲述如何在Openlayers3中结合canvas实现对地图的切割. 效果: 全图切割北京区域切割河北区域实现: <html xmlns="http://www.w3 ...
ROS-I工业机器人培训课程资料 2017-06-30
美国ROS工业联盟于2017年6月6日至8日在德克萨斯州圣安东尼奥市的SwRI举办了ROS工业开发人员培训班.12位与会者代表了一系列不同的组织,包括Bastian Solutions,EWI,Joh ...
向量点积(Dot Product),向量叉积(Cross Product)
参考的是<游戏和图形学的3D数学入门教程>,非常不错的书,推荐阅读,老外很喜欢把一个东西解释的很详细. 1.向量点积(Dot Product) 向量点积的结果有什么意义?事实上,向量的点积 ...

numpy中文件的存储和读取-嵩天老师笔记

numpy中csv文件的存储和读取