深度学习tensorflow实战笔记（2）图像转换成tfrecords和读取

1、准备数据

首选将自己的图像数据分类分别放在不同的文件夹下，比如新建data文件夹，data文件夹下分别存放up和low文件夹，up和low文件夹下存放对应的图像数据。也可以把up和low文件夹换成0和1。根据自己数据类别，自己设定。如图所示

以上三张图片注意看目录。这样数据就准备好了。

2、将图像数据转换成tfrecords

直接上代码，代码中比较重要的部分我都做了注释。

 import os

 import tensorflow as tf

 from PIL import Image

 import matplotlib.pyplot as plt

 import numpy as np

 sess=tf.InteractiveSession()

 cwd = "D://software//tensorflow//data//"  #数据所在目录位置

 classes = {'up', 'low'} #预先自己定义的类别，根据自己的需要修改

 writer = tf.python_io.TFRecordWriter("train.tfrecords")  #train表示转成的tfrecords数据格式的名字

 for index, name in enumerate(classes):

     class_path = cwd + name + "/"

     for img_name in os.listdir(class_path):

         img_path = class_path + img_name

         img = Image.open(img_path)

         img = img.resize((300, 300))  #图像reshape大小设置，根据自己的需要修改

         img_raw = img.tobytes()

         example = tf.train.Example(features=tf.train.Features(feature={

             "label": tf.train.Feature(int64_list=tf.train.Int64List(value=[index])),

             'img_raw': tf.train.Feature(bytes_list=tf.train.BytesList(value=[img_raw]))

         }))

         writer.write(example.SerializeToString())

 writer.close()

3、从tfrecords中读取数据

直接上代码：

 #读取文件

 def read_and_decode(filename,batch_size):

     #根据文件名生成一个队列

     filename_queue = tf.train.string_input_producer([filename])

     reader = tf.TFRecordReader()

     _, serialized_example = reader.read(filename_queue)   #返回文件名和文件

     features = tf.parse_single_example(serialized_example,

                                        features={

                                            'label': tf.FixedLenFeature([], tf.int64),

                                            'img_raw' : tf.FixedLenFeature([], tf.string),

                                        })

     img = tf.decode_raw(features['img_raw'], tf.uint8)

     img = tf.reshape(img, [300, 300, 3])                #图像归一化大小

    # img = tf.cast(img, tf.float32) * (1. / 255) - 0.5   #图像减去均值处理，根据自己的需要决定要不要加上

     label = tf.cast(features['label'], tf.int32)        

     #特殊处理，去数据的batch，如果不要对数据做batch处理，也可以把下面这部分不放在函数里

     img_batch, label_batch = tf.train.shuffle_batch([img, label],

                                                     batch_size= batch_size,

                                                     num_threads=64,

                                                     capacity=200,

                                                     min_after_dequeue=150)

     return img_batch, tf.reshape(label_batch,[batch_size])

需要注意的地方：

img = tf.cast(img, tf.float32) * (1. / 255) - 0.5   #图像减去均值处理，根据自己的需要决定要不要加上

 #特殊处理，去数据的batch，如果不要对数据做batch处理，也可以把下面这部分不放在函数里

     img_batch, label_batch = tf.train.shuffle_batch([img, label],

                                                     batch_size= batch_size,

                                                     num_threads=64,

                                                     capacity=200,

                                                     min_after_dequeue=150)

如果不需要把数据做batch处理，则函数的第二个形参batch_size就去掉，函数直接返回img和label。也可以把batch处理部分放在函数外面，根据自己的需要自己修改一下。

4、转换和读取函数的调用

 tfrecords_file = 'train.tfrecords'   #要读取的tfrecords文件

 BATCH_SIZE = 4      #batch_size的大小

 image_batch, label_batch = read_and_decode(tfrecords_file,BATCH_SIZE)

 print(image_batch,label_batch)    #注意，这里不是tensor，tensor需要做see.run()处理

下面就定义session，执行即可，有一个地方需要注意，

image_batch, label_batch = read_and_decode(tfrecords_file,BATCH_SIZE)   #需要注意

虽然能够把数据读取出来，但是不是tensor，在训练的时候需要image,label=sess.run([image_batch,label_batch])处理后，才能投入训练。具体细节下一篇博客再做详细介绍。

 如果还有问题未能得到解决，搜索887934385交流群，进入后下载资料工具安装包等。最后，感谢观看！

深度学习tensorflow实战笔记（2）图像转换成tfrecords和读取的更多相关文章

深度学习tensorflow实战笔记（1）全连接神经网络（FCN）训练自己的数据（从txt文件中读取）
1.准备数据把数据放进txt文件中(数据量大的话,就写一段程序自己把数据自动的写入txt文件中,任何语言都能实现),数据之间用逗号隔开,最后一列标注数据的标签(用于分类),比如0,1.每一行表示一个 ...
深度学习tensorflow实战笔记用预训练好的VGG-16模型提取图像特征
1.首先就要下载模型结构首先要做的就是下载训练好的模型结构和预训练好的模型,结构地址是:点击打开链接模型结构如下: 文件test_vgg16.py可以用于提取特征.其中vgg16.npy是需要单独 ...
深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识
深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识在tf第一个例子的时候需要很多预备知识. tf基本知识香农熵交叉熵代价函数cross-entropy 卷积神经网络 s ...
深度学习-tensorflow学习笔记(2)-MNIST手写字体识别
深度学习-tensorflow学习笔记(2)-MNIST手写字体识别超级详细版这是tf入门的第一个例子.minst应该是内置的数据集. 前置知识在学习笔记(1)里面讲过了这里直接上代码 # -*- ...
深度学习入门实战（二）-用TensorFlow训练线性回归
欢迎大家关注腾讯云技术社区-博客园官方主页,我们将持续在博客园为大家推荐技术精品文章哦~ 作者 :董超上一篇文章我们介绍了 MxNet 的安装,但 MxNet 有个缺点,那就是文档不太全,用起来可能 ...
深度学习Tensorflow相关书籍推荐和PDF下载
深度学习Tensorflow相关书籍推荐和PDF下载 baihualinxin关注 32018.03.28 10:46:16字数 481阅读 22,673 1.机器学习入门经典<统计学习方法&g ...
深度学习Keras框架笔记之AutoEncoder类
深度学习Keras框架笔记之AutoEncoder类使用笔记 keras.layers.core.AutoEncoder(encoder, decoder,output_reconstruction= ...
深度学习Keras框架笔记之TimeDistributedDense类
深度学习Keras框架笔记之TimeDistributedDense类使用方法笔记例: keras.layers.core.TimeDistributedDense(output_dim,init= ...
深度学习Keras框架笔记之Dense类(标准的一维全连接层)
深度学习Keras框架笔记之Dense类(标准的一维全连接层) 例: keras.layers.core.Dense(output_dim,init='glorot_uniform', activat ...

随机推荐

MySQL 深入理解索引B+树存储（转载））
出处:http://blog.codinglabs.org/articles/theory-of-mysql-index.html 摘要本文以MySQL数据库为研究对象,讨论与数据库索引相关的一 ...
spring boot项目下的application.properties中的logging.level设置日志级别
日志级别 trace<debug<info<warn<error<fatal 默认级别为info,即默认打印info及其以上级别的日志,如下: logging.level ...
B-线性代数-距离公式汇总
目录距离公式汇总一.欧式距离二.曼哈顿距离三.闵可夫斯基距离(Minkowski distance) 更新.更全的<机器学习>的更新网站,更有python.go.数据结构与算法.爬 ...
B-经济学-基尼指数
目录基尼指数一.基尼指数简介更新.更全的<机器学习>的更新网站,更有python.go.数据结构与算法.爬虫.人工智能教学等着你:https://www.cnblogs.com/ni ...
PCA 算法核心：高维度向量向低维度投影
Principal Component Analysis:主成分分析步骤 5 步: 1.去平均值,也就是将向量中每一项都减去各自向量的平均值 2.计算矩阵的方差,协方差,特征值, 3,.把特征值从大 ...
小白学 Python（2）：基础数据类型（上）
人生苦短,我选Python 引言前文传送门小白学 Python(1):开篇接触一门新的语言,肯定要先了解它的基础数据类型.啥?你问我为啥要先了解基础数据类型? 为了你的生命安全,还是乖乖听我 B ...
shark恒破解笔记6-BC++假自效验
这小节介绍了查壳(peid) 查软件编写语言(die)以及用esp定律脱aspack壳,最后是破解bc++的自校验部分目标: 首先查看软件 peid查壳有壳 ,但是不知道是什么语言写的,这里使用D ...
sql查询入门
SQL语言是一门相对来说简单易学却又功能强大的语言,它能让你快速上手并很快就能写出比较复杂的查询语句.但是对于大多数开发者来说,使用SQL语句查询数据库的时候,如果没有一个抽象的过程和一个合理的步骤, ...
去除img下方的空白（vertical-align：middle）——原理
代码如下:一个简单的div装在一个img中, 然而在预览时却发现这种情况也就是说img下方会无缘无故出现一个空隙.然后你发现,只要给img元素加上一个属性 vertical-align:middle ...
Leetcode（4）寻找两个有序数组的中位数
Leetcode(4)寻找两个有序数组的中位数 [题目表述]: 给定两个大小为 m 和 n 的有序数组 nums1 和* nums2. 请你找出这两个有序数组的中位数,并且要求算法的时间复杂度为 O( ...