h5py库

参考文献：http://docs.h5py.org/en/latest/high/dataset.html

h5py文件存放数据集（dataset）和组（group）。

dataset类似数组类的数据集合，和numpy的数组差不多。

group是像文件夹一样的容器，它好比python中的字典，有键(key)和值(value)。group中可以存放dataset或者其他的group。
”键”就是组成员的名称，”值”就是组成员对象本身(组或者数据集).

一、下面来看下如何创建group和dataset

import h5py

#如果是读取文件的话，w换成r

f = h5py.File("myh5py.hdf5","w");

二、创建dataset数据集

import h5py

f=h5py.File("myh5py.hdf5","w")

#deset1是数据集的name，（20,）代表数据集的shape，i代表的是数据集的元素类型

d1=f.create_dataset("dset1", (20,), 'i')

for key in f.keys():

    print(key)

    print(f[key].name)

    print(f[key].shape)

    print(f[key].value)

输出：

dset1

/dset1

(20,)

[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]

三、给数据集赋值

import h5py

import numpy as np

f=h5py.File("myh5py.hdf5","w")

d1=f.create_dataset("dset1",(20,),'i')

#赋值

d1[...]=np.arange(20)

#或者我们可以直接按照下面的方式创建数据集并赋值

f["dset2"]=np.arange(15)

for key in f.keys():

    print(f[key].name)

    print(f[key].value)

输出：

/dset1

[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19]

/dset2

[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14]

三、将现成的数据集传给参数data

import h5py

import numpy as np

f=h5py.File("myh5py.hdf5","w")

a=np.arange(20)

d1=f.create_dataset("dset1",data=a)

for key in f.keys():

    print(f[key].name)

    print(f[key].value)

输出：

/dset1

[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19]

四、混合创建数据集dataset

import h5py

import numpy as np

f=h5py.File("myh5py.hdf5","w")

#分别创建dset1,dset2,dset3这三个数据集

a=np.arange(20)

d1=f.create_dataset("dset1",data=a)

d2=f.create_dataset("dset2",(3,4),'i')

d2[...]=np.arange(12).reshape((3,4))

f["dset3"]=np.arange(15)

for key in f.keys():

    print(f[key].name)

    print(f[key].value)

输出：

/dset1

[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19]

/dset2

[[ 0  1  2  3]

 [ 4  5  6  7]

 [ 8  9 10 11]]

/dset3

[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14]

六、创建group组

import h5py

import numpy as np

f=h5py.File("myh5py.hdf5","w")

#创建一个名字为bar的组

g1=f.create_group("bar")

#在bar这个组里面分别创建name为dset1,dset2的数据集并赋值。

g1["dset1"]=np.arange(10)

g1["dset2"]=np.arange(12).reshape((3,4))

for key in g1.keys():

    print(g1[key].name)

    print(g1[key].value)

输出：

/bar/dset1

[0 1 2 3 4 5 6 7 8 9]

/bar/dset2

[[ 0  1  2  3]

 [ 4  5  6  7]

 [ 8  9 10 11]]

注意观察：现在这两个数据集都在bar这个group(组)里面，名字就变成了/bar+/名字，是不是有点文件夹的感觉

七、group和dataset的关系

import h5py

import numpy as np

f=h5py.File("myh5py.hdf5","w")

#创建组bar1,组bar2，数据集dset

g1=f.create_group("bar1")

g2=f.create_group("bar2")

d=f.create_dataset("dset",data=np.arange(10))

#在bar1组里面创建一个组car1和一个数据集dset1。

c1=g1.create_group("car1")

d1=g1.create_dataset("dset1",data=np.arange(10))

#在bar2组里面创建一个组car2和一个数据集dset2

c2=g2.create_group("car2")

d2=g2.create_dataset("dset2",data=np.arange(10))

#根目录下的组和数据集

print(".............")

for key in f.keys():

    print(f[key].name)

#bar1这个组下面的组和数据集

print(".............")

for key in g1.keys():

    print(g1[key].name)

#bar2这个组下面的组和数据集

print(".............")

for key in g2.keys():

    print(g2[key].name)

#顺便看下car1组和car2组下面都有什么，估计你都猜到了为空。

print(".............")

print(c1.keys())

print(c2.keys())

输出：

.............

/bar1

/bar2

/dset

.............

/bar1/car1

/bar1/dset1

.............

/bar2/car2

/bar2/dset2

.............

[]

[]

八、高级特征

用关键词compression来指定压缩滤波器，而滤波器的可选参数使用关键词compression_opt来指定：

dset = f.create_dataset("zipped", (100, 100), compression="gzip")

h5py库的更多相关文章

h5py库安装问题解决
H5py官网教程完全有问题,这个大家都这么说,但是貌似问题出现在Numpy上,由于numpy的版本过高! 这里是官网的教程:http://docs.h5py.org/en/latest/build.h ...
python库——h5py入门讲解
本文只是简单的对h5py库的基本创建文件,数据集和读取数据的方式进行介绍,作者刚接触h5py,完全靠看文档自学,如果哪里说的不对,欢迎纠正!如果读者需要进一步详细的学习h5py的更多知识,请参考h5p ...
Linux写配置HDF5的python包h5py
闲言碎语不讲,直接进入正题.Python在科学计算的应用越来越丰度,而hdf(5)数据的应用也非常广泛.python提供了h5py包供开发者处理数据(http://www.h5py.org/).在wi ...
tensorflow 学习日志
Windows安装anaconda 和 TensorFlow anaconda : https://zhuanlan.zhihu.com/p/25198543 anaconda 使用与说 ...
c++ 读取不了hdf5文件中的字符串
问题描述: 在拿到一个hdf5文件,想用c++去读取文件中的字符串,但是会报错:read failed ps: c++读取hdf5的字符串方法见:https://support.hdfgroup.or ...
Ubuntu: HDF5报错: HDF5 header version与HDF5 library不匹配
今天在执行一个用到hdf5的python脚本时,遇到如下错误 Warning! ***HDF5 library version mismatched error*** The HDF5 header ...
AI从入门到放弃：CNN的导火索，用MLP做图像分类识别？
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 作者:郑善友腾讯MIG后台开发工程师导语:在没有CNN以及更先进的神经网络的时代,朴素的想法是用多层感知机(MLP)做图片分类的识别:但 ...
利用Python进行数据分析第6章数据加载、存储与文件格式（2）
6.2 二进制数据格式实现数据的高效二进制格式存储最简单的办法之一,是使用Python内置的pickle序列化. pandas对象都有一个用于将数据以pickle格式保存到磁盘上的to_pickle ...
Python+H5py实现将SVHN样本库转换为FasterRcnn训练样本
一.上代码 import os import h5py svhnPath = 'D:\\Project\\AIProject\\SVHNClassifier\\data' def loadSvhn(p ...

随机推荐

Synchronized和ReentranLock的比较
并发编程最容易遇到的问题就是就是安全问题,因此解决方式有两种使用同步方法或同步代码块(Synchronized关键字) 使用锁机制(ReentranLock) 同步方法和同步代码块(Synchron ...
bzoj2346 & loj2632 [Baltic 2011]Lamp 最短路
题目传送门 https://lydsy.com/JudgeOnline/problem.php?id=2346 https://loj.ac/problem/2632 题解普及组难度的题都要想十几分 ...
2017 山东一轮集训 Day2 Shadow (三维凸包点在面上投影)
在三维坐标中,给定一个点光源,一个凸多面体,以及一个平面作为地面. 求该凸多面体在地面上阴影的面积. 这三个点共同确定了一个平面,这个平面就是地面.保证这三个点坐标互异且不共线.前三行每行三个实数,每 ...
远程仓库（GitHub）的使用
1.注册登录在 GitHub 上注册登录暂时忽略不讲 2.创建新的远程仓库在GitHub网站上创建新的仓库.不管你是先在本地创建仓库还是先在远程创建仓库,要想把代码提交到远程仓库都是要先手动创建 ...
网络体系之TCP/IP模型
TCP/IP参考模型是因特网使用的参考模型,这个体系结构在它的两个主要协议出现以后,被称为TCP/IP参考模型.该模型将网络协议分为四层:网络接口层.网络层.运输层.应用层. TCP/IP协议不是TC ...
linux0.11内核源码——进程各状态切换的跟踪
准备工作 1.进程的状态有五种:新建(N),就绪或等待(J),睡眠或阻塞(W),运行(R),退出(E),其实还有个僵尸进程,这里先忽略 2.编写一个样本程序process.c,里面实现了一个函数 /* ...
Python基础教程（018）--官方解释器交互运行
前言: 在交互式运行Python程序内容在Python的shell中直接输入Python的代码,可以立即执行结果交互式运行Python的优缺点 1,缺点--代码不能保存 2,不适合运行太大的程序 ...
EAM(Enterprise Asset Management)企业资产管理系统
EAM (Enterprise Asset Management)的缩写,EAM系统是指企业资产管理系统. EAM系统是在资产比重较大的企业,在资产建设.维护中减少维护成本,提高资产运营效率,通过现代 ...
2019 牛客暑期多校第三场 F Planting Trees (单调队列+尺取）
题目:https://ac.nowcoder.com/acm/contest/883/F 题意:求一个矩阵最大面积,这个矩阵的要求是矩阵内最小值与最大值差值<=m 思路:首先我们仔细观察范围,我 ...
Codeforces Round #506 (Div. 3) E
Codeforces Round #506 (Div. 3) E dfs+贪心 #include<bits/stdc++.h> using namespace std; typedef l ...

h5py库

h5py库的更多相关文章

随机推荐

热门专题