OFRecord 图片文件制数据集

在 OFRecord 数据格式和加载与准备 OFRecord 数据集中，分别学习了 OFRecord 数据格式，以及如何将其它数据集转为 OFRecord 数据集并使用。

本文介绍如何将图片文件制作为 OFRecord 数据集，并提供了相关的制作脚本，方便用户直接使用或者在此基础上修改。内容包括：

制作基于 MNIST 手写数字数据集的 OFRecord 数据集
OFRecord 的编解码方式
在自制的 OFRecord 数据集上进行训练

用图片文件制作 OFRecord 文件

使用 MNIST 数据集中的图片文件来制作一个 OFRecord 格式文件。

作为示例，仅使用了50张图片，相关脚本和数据集的下载地址为 img2ofrecord

下载相关压缩包并解压

$ wget https://oneflow-static.oss-cn-beijing.aliyuncs.com/oneflow-tutorial-attachments/img2ofrecord.zip

$ unzip img2ofrecord.zip

进入到对应目录，并运行 OFRecord 制作脚本 img2ofrecord.py

$ cd ./img_to_ofrecord

$ python img2ofrecord.py --part_num=5 --save_dir=./dataset/ --img_format=.png --image_root=./images/train_set/

脚本运行过程中，将输出以下内容

The image root is: ./images/train_set/

The amount of OFRecord data part is: 5

The directory of Labels is: ./images/train_label/label.txt

The image format is: .png

The OFRecord save directory is: ./dataset/

Start Processing......

./images/train_set/00000030_3.png feature saved

./images/train_set/00000034_0.png feature saved

./images/train_set/00000026_4.png feature saved

./images/train_set/00000043_9.png feature saved

......

Process image successfully !!!

至此 OFRecord 文件制作完毕，并保存在 ./dataset 目录下

代码解读

整个代码目录构造如下

img_to_ofrecord

├── images

├── train_set

├── 00000000_5.png

├── 00000001_0.png

├── 00000002_4.png

......

├── train_label

├── label.txt

├── img2ofrecord.py

├── lenet_train.py

images 目录存放原始示例训练数据集以及标签文件

的标签文件是以 json 格式存储的，格式如下：

{"00000030_3.png": 3}

{"00000034_0.png": 0}

{"00000026_4.png": 4}

{"00000043_9.png": 9}

{"00000047_5.png": 5}

{"00000003_1.png": 1}

......

img2ofrecord.py 脚本将 MNIST 图片转换成 OFRecord 数据集
lenet_train.py 脚本则读取制作好的 OFRecord 数据集，并使用 LeNet 模型进行训练。

img2ofrecord.py 的命令行选项如下：

image_root 指定图片的根目录路径
part_num 指定生成 OFRecord 文件个数，如果该数目大于总图片数目，会报错
label_dir 指定标签的目录路径
img_format 指定图片的格式
save_dir 指定 OFRecord 文件保存的目录

脚本的编码流程

与 OFRecord 文件编码的相关逻辑也在 img2ofrecord.py 内，其编码流程如下：

首先，对读取进来的图片数据进行编码

def encode_img_file(filename, ext=".jpg"):

img = cv2.imread(filename)

encoded_data = cv2.imencode(ext, img)[1]

return encoded_data.tostring()

这里的 ext 是图片编码格式，目前，OneFlow 图片编解码支持的格式与 OpenCV 的一致，可参见 cv::ImwriteFlags，包括：

JPEG，一种最常见的有损编码格式，可参考 JPEG
PNG，一种常见的无损位图编码格式，可参考 Portable Network Graphics
TIFF，一种可扩展的压缩编码格式，可参考 Tagged Image File Format

然后，转化成 Feature 的形式，进行序列化，并将数据长度写入到文件中

def ndarray2ofrecords(dsfile, dataname, encoded_data, labelname, encoded_label):

topack = {dataname: bytes_feature(encoded_data),

labelname: int32_feature(encoded_label)}

ofrecord_features = ofrecord.OFRecord(feature=topack)

serilizedBytes = ofrecord_features.SerializeToString()

length = ofrecord_features.ByteSize()

dsfile.write(struct.pack("q", length))

dsfile.write(serilizedBytes)

使用自制的 OFRecord 数据集进行训练

运行目录下的 lenet_train.py，它将读取刚制作好的 OFRecord 数据集，在 Lenet 模型上进行训练

该训练脚本输出如下：

[6.778578]

[2.0212684]

[1.3814741]

[0.47514156]

[0.13277876]

[0.16388433]

[0.03788032]

[0.01225162]

......

至此，成功完成了数据集制作、读取与训练整个流程。

OFRecord 图片文件制数据集的更多相关文章

JavaScript根据文件名后缀判断是否图片文件
//JavaScript根据文件名后缀判断是否图片文件 //图片文件的后缀名 var imgExt = new Array(".png",".jpg",&quo ...
【荐】PHP操作MongoDB GridFS 存储文件，如图片文件
GridFS是MongoDB的一个内置功能,它提供一组文件操作的API以利用MongoDB存储文件,GridFS的基本原理是将文件保存在两个Collection中,一个保存文件索引,一个保存文件内容, ...
FileReader：读取本地图片文件并显示
最近忙得比狗还惨,导致长时间没能更新文章,真心对不住啊.抽空整理了下关于在页面上读取和显示本地图片的实例文章,本文通过实例讲解如何使用支持FileReader浏览器的用户将能够通过一个file inp ...
springmvc图片文件上传接口
springmvc图片文件上传用MultipartFile文件方式传输 Controller package com.controller; import java.awt.image.Buffer ...
C#对图片文件的压缩、裁剪操作初探
在做项目时,对图片的处理,以前都采用在上传时,限制其大小的方式,这样带来诸多不便.毕竟网站运维人员不一定会对图片做处理,经常超出大小限制,即使会使用图片处理软件的,也由于个人水平方面原因,处理效果差强 ...
Qt 怎么添加图片文件？
1.新建一个.qrc的文件 2.起个.qrc的文件名 3.完成后,添加图片文件 4.如图就好了.
C#对图片文件的压缩、裁剪操作
在做项目时,对图片的处理,以前都采用在上传时,限制其大小的方式,这样带来诸多不便.毕竟网站运维人员不一定会对图片做处理,经常超出大小限制,即使会使用图片处理软件的,也由于个人水平方面原因,处理效果差强 ...
[深入浅出WP8.1(Runtime)]生成图片和存储生成的图片文件
7.2.3 使用RenderTargetBitmap类生成图片 RenderTargetBitmap类可以将可视化对象转换为位图,也就是说它可以将任意的UIElement以位图的形式呈现.那么我们在实 ...
将gridFS中的图片文件写入硬盘
开启用户验证下的gridfs 连接使用,在执行脚本前可以在python shell中 from pymongo import Connectionfrom gridfs import *con = C ...

随机推荐

php 二维数组排序详解: array_multisort
定义和用法 array_multisort() 函数返回一个排序数组.您可以输入一个或多个数组.函数先对第一个数组进行排序,接着是其他数组,如果两个或多个值相同,它将对下一个数组进行排序. 注释: ...
POJ2688状态压缩（可以+DFS剪枝）
题意: 给你一个n*m的格子,然后给你一个起点,让你遍历所有的垃圾,就是终点不唯一,问你最小路径是多少? 思路: 水题,方法比较多,最省事的就是直接就一个BFS状态压缩暴搜就行 ...
Win64 驱动内核编程-11.回调监控进线程句柄操作
无HOOK监控进线程句柄操作在 NT5 平台下,要监控进线程句柄的操作. 通常要挂钩三个API:NtOpenProcess.NtOpenThread.NtDuplicateObject.但是在 VI ...
记一次 .NET 医院CIS系统内存溢出分析
一:背景 1. 讲故事前几天有位朋友加wx求助说他的程序最近总是出现内存溢出,很崩溃,如下图: 和这位朋友聊下来,发现他也是搞医疗的,哈哈,.NET 在医疗方面还是很有市场的,不过对于内存方面出的问 ...
初入MongoDB
初入MongoDB 业务需求,需要用到MongoDB.向来一直是mysql数据库的思想,一下转换为nosql还是很不适应.经过一个月的开发,写一下自己的感触.本文会对应mysql数据库进行说明. 数据 ...
upload
File saveDir=new File("D:/Test/UPLOAD"); if(!saveDir.isDirectory()){ saveDir.mkdirs(); } F ...
数据表格 layui.table
layui官网-表单自动渲染方法渲染 table.render,cols中的field是后台传递的data map.put("data",stuService.selectSt ...
window下批量删除指定后缀文件
例子: 批量删除当前路径下后缀为 .jpg和 .json del /a /f /s /q "*.jpg" "*.json" *为通配符/a /f 是强制删除所有 ...
段间跳转之TSS段
TR寄存器,TSS描述符,TSS段 TR寄存器与普通的段寄存器一样都有可见部分和不可见部分.TR的可见部分为16位为其段选择子,不可见部分是32位的TSS基地址和16位的大小. TSS描述符存在GDT ...
Java安全之Fastjson反序列化漏洞分析
Java安全之Fastjson反序列化漏洞分析首发:先知论坛 0x00 前言在前面的RMI和JNDI注入学习里面为本次的Fastjson打了一个比较好的基础.利于后面的漏洞分析. 0x01 Fas ...

OFRecord 图片文件制数据集

OFRecord 图片文件制数据集的更多相关文章

随机推荐

热门专题