Tensorflow细节-P170-图像数据预处理

由于6.5中提出的TFRecord非常复杂，可扩展性差，所以本节换一种方式

import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data

import numpy as np

# 定义函数转化变量类型。

def _int64_feature(value):

    return tf.train.Feature(int64_list=tf.train.Int64List(value=[value]))  # 生成整数类型的属性

def _bytes_feature(value):

    return tf.train.Feature(bytes_list=tf.train.BytesList(value=[value]))  # 生成字符串类型的属性

# 将数据转化为tf.train.Example格式。

def _make_example(pixels, label, image):

    image_raw = image.tostring()

    example = tf.train.Example(features=tf.train.Features(feature={

        'pixels': _int64_feature(pixels),

        'label': _int64_feature(np.argmax(label)),

        'image_raw': _bytes_feature(image_raw)

    }))

    return example

# 读取mnist训练数据。

mnist = input_data.read_data_sets("./datasets/MNIST_data",dtype=tf.uint8, one_hot=True)

images = mnist.train.images

labels = mnist.train.labels

pixels = images.shape[1]  # 784

num_examples = mnist.train.num_examples  # 60000

# 输出包含训练数据的TFRecord文件。

with tf.python_io.TFRecordWriter("./datasets/output.tfrecords") as writer:

    for index in range(num_examples):

        example = _make_example(pixels, labels[index], images[index])

        writer.write(example.SerializeToString())

print("TFRecord训练文件已保存。")

# 读取mnist测试数据。

images_test = mnist.test.images

labels_test = mnist.test.labels

pixels_test = images_test.shape[1]

num_examples_test = mnist.test.num_examples

# 输出包含测试数据的TFRecord文件。

with tf.python_io.TFRecordWriter("./datasets/output_test.tfrecords") as writer:

    for index in range(num_examples_test):

        example = _make_example(

            pixels_test, labels_test[index], images_test[index])

        writer.write(example.SerializeToString())

print("TFRecord测试文件已保存。")

读取时注意使用了多线程

import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data

import numpy as np

# 定义函数转化变量类型。

def _int64_feature(value):

    return tf.train.Feature(int64_list=tf.train.Int64List(value=[value]))  # 生成整数类型的属性

def _bytes_feature(value):

    return tf.train.Feature(bytes_list=tf.train.BytesList(value=[value]))  # 生成字符串类型的属性

# 将数据转化为tf.train.Example格式。

def _make_example(pixels, label, image):

    image_raw = image.tostring()

    example = tf.train.Example(features=tf.train.Features(feature={

        'pixels': _int64_feature(pixels),

        'label': _int64_feature(np.argmax(label)),

        'image_raw': _bytes_feature(image_raw)

    }))

    return example

# 读取mnist训练数据。

mnist = input_data.read_data_sets("./datasets/MNIST_data",dtype=tf.uint8, one_hot=True)

images = mnist.train.images

labels = mnist.train.labels

pixels = images.shape[1]  # 784

num_examples = mnist.train.num_examples  # 60000

# 输出包含训练数据的TFRecord文件。

with tf.python_io.TFRecordWriter("./datasets/output.tfrecords") as writer:

    for index in range(num_examples):

        example = _make_example(pixels, labels[index], images[index])

        writer.write(example.SerializeToString())

print("TFRecord训练文件已保存。")

# 读取mnist测试数据。

images_test = mnist.test.images

labels_test = mnist.test.labels

pixels_test = images_test.shape[1]

num_examples_test = mnist.test.num_examples

# 输出包含测试数据的TFRecord文件。

with tf.python_io.TFRecordWriter("./datasets/output_test.tfrecords") as writer:

    for index in range(num_examples_test):

        example = _make_example(

            pixels_test, labels_test[index], images_test[index])

        writer.write(example.SerializeToString())

print("TFRecord测试文件已保存。")

Tensorflow细节-P170-图像数据预处理的更多相关文章

TensorFlow中读取图像数据的三种方式
本文面对三种常常遇到的情况,总结三种读取数据的方式,分别用于处理单张图片.大量图片,和TFRecorder读取方式.并且还补充了功能相近的tf函数. 1.处理单张图片我们训练完模型之后,常常要用图片 ...
TensorFlow从1到2（三）数据预处理和卷积神经网络
数据集及预处理从这个例子开始,相当比例的代码都来自于官方新版文档的示例.开始的几个还好,但随后的程序都将需要大量的算力支持.Google Colab是一个非常棒的云端实验室,提供含有TPU/GPU支 ...
『TensorFlow』SSD源码学习_其五：TFR数据读取&数据预处理
Fork版本项目地址:SSD 一.TFR数据读取创建slim.dataset.Dataset对象在train_ssd_network.py获取数据操作如下,首先需要slim.dataset.Dat ...
【2】TensorFlow光速入门-数据预处理（得到数据集）
本文地址:https://www.cnblogs.com/tujia/p/13862351.html 系列文章: [0]TensorFlow光速入门-序 [1]TensorFlow光速入门-tenso ...
【caffe I/O】数据变换器（图像的预处理部分）代码注释
caffe.proto中TransformationParameter部分 // Message that stores parameters used to apply transformation ...
（转）原始图像数据和PDF中的图像数据
比较原始图像数据和PDF中的图像数据,结果见表1.1.表1.1中各种“解码器”的解释见本文后续的“PDF支持的图像格式”部分,“PDF中的图像数据”各栏中的数据来自开源的PdfView.如果您有兴趣查 ...
TensorLayer官方中文文档1.7.4：API – 数据预处理
所属分类:TensorLayer API - 数据预处理¶ 我们提供大量的数据增强及处理方法,使用 Numpy, Scipy, Threading 和 Queue. 不过,我们建议你直接使用 Tens ...
tensorflow学习笔记——图像数据处理
喜欢摄影的盆友都知道图像的亮度,对比度等属性对图像的影响是非常大的,相同物体在不同亮度,对比度下差别非常大.然而在很多图像识别问题中,这些因素都不应该影响最后的结果.所以本文将学习如何对图像数据进行预 ...
Deep Learning 11_深度学习UFLDL教程：数据预处理（斯坦福大学深度学习教程）
理论知识:UFLDL数据预处理和http://www.cnblogs.com/tornadomeet/archive/2013/04/20/3033149.html 数据预处理是深度学习中非常重要的一 ...

随机推荐

C++中的强制类型转换
在C语言中,强制类型转换的方式为(Type)Expression,另外还有一种现在已经不用的旧式写法Type(Expression),这两种方式是等价的. 但是,C语言的强制类型转换方式存在一些问题: ...
springboot 配置elasticsearch Java High Rest Client
前提声明在新版本的spring boot中逐渐放弃了对Spring Data Elasticsearch的支持,所以不推荐使用,使用ES官方推出的Java High Rest Client. 引入依 ...
VirtualBox安装文档教程
1找到安装包双击打开 2 3 这里可以更改安装路径 4 5 6 7 等待安装 8
查看线程CPU利用率
查看线程CPU利用率方法1:利用ps命令查看对应的线程 1. ps -ef | grep 进程名称 2. ps -mp 进程ID -o THREAD,pid,tid,cmd,time,%cpu,%m ...
idea多级目录不展开的问题
遇见了一个坑,idea新建的包,和它的上级包重叠在了一起,无法形成树状结构原因呢,还是因为自己的不细心了,解决方案很简单,下面的是原情况解决方案,点击左侧栏右上角的设置图表,注意看红框内把第一行 ...
C#中的Process类使用
有时候,用户在进行某个操作时,程序运行到某个阶段突然崩溃,我们需要让程序自动重启,重新执行用户之前的操作,当发现主程序还存在,就重启用户执行的附加程序.这时候Process就派上了用场. 控制台测试用 ...
文件属性的生成操作build action
文件属性的生成操作build action Action 说明 None 资源既不会被集成到程序集内,也不会打包到xap包中.不过我们可以通过设置CopyToOutputDirectory选项让其自动 ...
ABP 基于DDD的.NET开发框架学习（七）继承不同的service直接调用api的区别
1.IApplicationService->IBaseService->具体IXXXService 具体XXXService->BaseService,具体IXXXService ...
Java CPU占用过高问题排查,windows和Linux
LINUX系统: linux系统比较简单: 1.使用命令 ps -ef | grep 找出异常java进程的pid. 找出pid为 20189 2. top -H -p 20189,所有该进程的线程 ...
idea全局护眼色绿豆沙
1.settings->plugins->BackgroundImage 2.在导航栏选择Help->FindAction 3.set background image 4.选择图片 ...

Tensorflow细节-P170-图像数据预处理

Tensorflow细节-P170-图像数据预处理的更多相关文章

随机推荐

热门专题