图像操作

图像基本概念

在图像数字化表示当中，分为黑白和彩色两种。在数字化表示图片的时候，有三个因素。分别是图片的长、图片的宽、图片的颜色通道数。那么黑白图片的颜色通道数为1，它只需要一个数字就可以表示一个像素位；而彩色照片就不一样了，它有三个颜色通道，分别为RGB，通过三个数字表示一个像素位。TensorFlow支持JPG、PNG图像格式，RGB、RGBA颜色空间。图像用与图像尺寸相同(heightwidthchnanel)张量表示。图像所有像素存在磁盘文件，需要被加载到内存。

图像大小压缩

大尺寸图像输入占用大量系统内存。训练CNN需要大量时间，加载大文件增加更多训练时间，也难存放多数系统GPU显存。大尺寸图像大量无关本征属性信息，影响模型泛化能力。最好在预处理阶段完成图像操作，缩小、裁剪、缩放、灰度调整等。图像加载后，翻转、扭曲，使输入网络训练信息多样化，缓解过拟合。Python图像处理框架PIL、OpenCV。TensorFlow提供部分图像处理方法。

tf.image.resize_images 压缩图片导致定大小

图像数据读取实例

同样图像加载与二进制文件相同。图像需要解码。输入生成器(tf.train.string_input_producer)找到所需文件，加载到队列。tf.WholeFileReader 加载完整图像文件到内存，WholeFileReader.read 读取图像，tf.image.decode_jpeg 解码JPEG格式图像。图像是三阶张量。RGB值是一阶张量。加载图像格式为[batch_size,image_height,image_width,channels]。批数据图像过大过多，占用内存过高，系统会停止响应。直接加载TFRecord文件，可以节省训练时间。支持写入多个样本。

读取图片数据到Tensor

管道读端多文件内容处理

但是会发现read只返回一个图片的值。所以我们在之前处理文件的整个流程中，后面的内容队列的出队列需要用特定函数去获取。

tf.train.batch 读取指定大小（个数）的张量
tf.train.shuffle_batch 乱序读取指定大小（个数）的张量

def readpic_decode(file_list):

    """

    批量读取图片并转换成张量格式

    :param file_list: 文件名目录列表

    :return: None

    """

    # 构造文件队列

    file_queue = tf.train.string_input_producer(file_list)

    # 图片阅读器和读取数据

    reader = tf.WholeFileReader()

    key,value = reader.read(file_queue)

    # 解码成张量形式

    image_first = tf.image.decode_jpeg(value)

    print(image_first)

    # 缩小图片到指定长宽，不用指定通道数

    image = tf.image.resize_images(image_first,[256,256])

    # 设置图片的静态形状

    image.set_shape([256,256,3])

    print(image)

    # 批处理图片数据，tensors是需要具体的形状大小

    image_batch = tf.train.batch([image],batch_size=100,num_threads=1,capacity=100)

    tf.summary.image("pic",image_batch)

    with tf.Session() as sess:

        merged = tf.summary.merge_all()

        filewriter = tf.summary.FileWriter("/tmp/summary/dog/",graph=sess.graph)

        # 线程协调器

        coord = tf.train.Coordinator()

        # 开启线程

        threads = tf.train.start_queue_runners(sess=sess,coord=coord)

        print(sess.run(image_batch))

        summary = sess.run(merged)

        filewriter.add_summary(summary)

        # 等待线程回收

        coord.request_stop()

        coord.join(threads)

    return None

if __name__=="__main__":

    # 获取文件列表

    filename = os.listdir("./dog/")

    # 组合文件目录和文件名

    file_list = [os.path.join("./dog/",file) for file in filename]

    # 调用读取函数

    readpic_decode(file_list)

读取TfRecords文件数据

#CIFAR-10的数据读取以及转换成TFRecordsg格式

#1、数据的读取

FLAGS = tf.app.flags.FLAGS

tf.app.flags.DEFINE_string("data_dir","./cifar10/cifar-10-batches-bin/","CIFAR数据目录")

tf.app.flags.DEFINE_integer("batch_size",50000,"样本个数")

tf.app.flags.DEFINE_string("records_file","./cifar10/cifar.tfrecords","tfrecords文件位置")

class CifarRead(object):

    def __init__(self,filename):

        self.filelist = filename

        # 定义图片的长、宽、深度，标签字节，图像字节，总字节数

        self.height = 32

        self.width = 32

        self.depth = 3

        self.label_bytes = 1

        self.image_bytes = self.height*self.width*self.depth

        self.bytes = self.label_bytes + self.image_bytes

    def readcifar_decode(self):

        """

        读取数据，进行转换

        :return: 批处理的图片和标签

        """

        # 1、构造文件队列

        file_queue = tf.train.string_input_producer(self.filelist)

        # 2、构造读取器，读取内容

        reader = tf.FixedLengthRecordReader(self.bytes)

        key,value = reader.read(file_queue)

        # 3、文件内容解码

        image_label = tf.decode_raw(value,tf.uint8)

        # 分割标签与图像张量，转换成相应的格式

        label = tf.cast(tf.slice(image_label,[0],[self.label_bytes]),tf.int32)

        image = tf.slice(image_label,[self.label_bytes],[self.image_bytes])

        print(image)

        # 给image设置形状，防止批处理出错

        image_tensor = tf.reshape(image,[self.height,self.width,self.depth])

        print(image_tensor.eval())

        # depth_major = tf.reshape(image, [self.depth,self.height, self.width])

        # image_tensor = tf.transpose(depth_major, [1, 2, 0])

        # 4、处理流程

        image_batch,label_batch = tf.train.batch([image_tensor,label],batch_size=10,num_threads=1,capacity=10)

        return image_batch,label_batch

    def convert_to_tfrecords(self,image_batch,label_batch):

        """

        转换成TFRecords文件

        :param image_batch: 图片数据Tensor

        :param label_batch: 标签数据Tensor

        :param sess: 会话

        :return: None

        """

        # 创建一个TFRecord存储器

        writer = tf.python_io.TFRecordWriter(FLAGS.records_file)

        # 构造每个样本的Example

        for i in range(10):

            print("---------")

            image = image_batch[i]

            # 将单个图片张量转换为字符串，以可以存进二进制文件

            image_string = image.eval().tostring()

            # 使用eval需要注意的是，必须存在会话上下文环境

            label = int(label_batch[i].eval()[0])

            # 构造协议块

            example = tf.train.Example(features=tf.train.Features(feature={

                "image": tf.train.Feature(bytes_list=tf.train.BytesList(value=[image_string])),

                "label": tf.train.Feature(int64_list=tf.train.Int64List(value=[label]))

            })

            )

            # 写进文件

            writer.write(example.SerializeToString())

        writer.close()

        return None

    def read_from_tfrecords(self):

        """

        读取tfrecords

        :return: None

        """

        file_queue = tf.train.string_input_producer(["./cifar10/cifar.tfrecords"])

        reader = tf.TFRecordReader()

        key, value = reader.read(file_queue)

        features = tf.parse_single_example(value, features={

            "image":tf.FixedLenFeature([], tf.string),

            "label":tf.FixedLenFeature([], tf.int64),

        })

        image = tf.decode_raw(features["image"], tf.uint8)

        # 设置静态形状，可用于转换动态形状

        image.set_shape([self.image_bytes])

        print(image)

        image_tensor = tf.reshape(image,[self.height,self.width,self.depth])

        print(image_tensor)

        label = tf.cast(features["label"], tf.int32)

        print(label)

        image_batch, label_batch = tf.train.batch([image_tensor, label],batch_size=10,num_threads=1,capacity=10)

        print(image_batch)

        print(label_batch)

        with tf.Session() as sess:

            coord = tf.train.Coordinator()

            threads = tf.train.start_queue_runners(sess=sess,coord=coord)

            print(sess.run([image_batch, label_batch]))

            coord.request_stop()

            coord.join(threads)

        return None

if __name__=="__main__":

    # 构造文件名字的列表

    filename = os.listdir(FLAGS.data_dir)

    file_list = [os.path.join(FLAGS.data_dir, file) for file in filename if file[-3:] == "bin"]

    cfar = CifarRead(file_list)

    # image_batch,label_batch = cfar.readcifar_decode()

    cfar.read_from_tfrecords()

    with tf.Session() as sess:

        # 构建线程协调器

        coord = tf.train.Coordinator()

        # 开启线程

        threads = tf.train.start_queue_runners(sess=sess, coord=coord)

        # print(sess.run(image_batch))

        # 存进文件

        # cfar.convert_to_tfrecords(image_batch, label_batch)

        coord.request_stop()

        coord.join(threads)

Tensorflow图像操作的更多相关文章

学习笔记TF015:加载图像、图像格式、图像操作、颜色
TensorFlow支持JPG.PNG图像格式,RGB.RGBA颜色空间.图像用与图像尺寸相同(height*width*chnanel)张量表示.通道表示为包含每个通道颜色数量标量秩1张量.图像所有 ...
TensorFlowIO操作（三）------图像操作
图像操作图像基本概念在图像数字化表示当中,分为黑白和彩色两种.在数字化表示图片的时候,有三个因素.分别是图片的长.图片的宽.图片的颜色通道数.那么黑白图片的颜色通道数为1,它只需要一个数字就可以表 ...
HT for Web基于HTML5的图像操作（三）
上篇采用了HTML5的Canvas的globalCompositeOperation属性达到了染色效果,其实CSS也提供了一些常规图像变化的设置参数,关于CSS的过滤器Filter设置可参考 http ...
2014 年10个最佳的PHP图像操作库
2014 年10个最佳的PHP图像操作库 Thomas Boutell 以及众多的开发者创造了以GD图形库闻名的一个图形软件库,用于动态的图形计算. GD提供了对于诸如C, Perl, Pytho ...
2014 年10个最佳的PHP图像操作库--留着有用
Thomas Boutell 以及众多的开发者创造了以GD图形库闻名的一个图形软件库,用于动态的图形计算. GD提供了对于诸如C, Perl, Python, PHP, OCaml等等诸多编程语言的支 ...
10个最佳的PHP图像操作库
Thomas Boutell 以及众多的开发者创造了以GD图形库闻名的一个图形软件库,用于动态的图形计算. GD提供了对于诸如C, Perl, Python, PHP, OCaml等等诸多编程语言的支 ...
C#中Bitmap类对图像の操作可检测图片完整性
try { Bitmap bm = new Bitmap(pics[ip]); BitmapToBytes(bm).Reverse().Take(2); } catch (Exception ex) ...
Python用Pillow(PIL)进行简单的图像操作
Python用Pillow(PIL)进行简单的图像操作颜色与RGBA值计算机通常将图像表示为RGB值,或者再加上alpha值(通透度,透明度),称为RGBA值.在Pillow中,RGBA的值表示为 ...
JAVA 图像操作辅助类
package util; import java.awt.Component; import java.awt.Image; import java.awt.MediaTracker; import ...

随机推荐

教你正确进入DFU及恢复模式无敌重刷模式
苹果分为两种恢复模式,一种叫做DFU模式,另一种是恢复模式.DFU的全称是Development FirmwareUpgrade,实际意思就是iPhone固件的强制升降级模式.而恢复模式则是屏幕上会显 ...
20155117王震宇 2016-2017-2 《Java程序设计》第七周学习总结
教材学习内容总结时间度量格林尼治标准时间(GMT):现在GMT已不作为标准时间使用. 世界时(UT):借助观测远方星体跨过子午线而得,受地球自转速度影响. 国际原子时(TAI):铯原子辐射振动幅度 ...
java反射机制的作用与优点
java的反射机制就是增加程序的灵活性,避免将程序写死到代码里,例如: 实例化一个 person()对象, 不使用反射, new person(); 如果想变成实例化其他类, 那么必须修改源代码, ...
杭电 KazaQ's Socks
KazaQ wears socks everyday. At the beginning, he has n pairs of socks numbered from 1 to n in his cl ...
MySql5.5安装（windows）
首先贴出安装包 32位安装包链接:https://pan.baidu.com/s/1AGLpcKv1I4kvWjPsVMyS8Q 密码:xypy 64位安装包链接:https://pan.baidu. ...
LG2044 [NOI2012]随机数生成器
题意栋栋最近迷上了随机算法,而随机数是生成随机算法的基础.栋栋准备使用线性同余法(Linear Congruential Method)来生成一个随机数列,这种方法需要设置四个非负整数参数m,a,c ...
树莓派挂载和卸载U盘或移动硬盘
通常我们在 /mnt 或 /media 目录下新建一个目录udisk作为挂载点 sudo mkdir /mnt/udisk 1.手动挂载: 挂载命令: sudo mount -o uid=pi,gid ...
Windows下搭建Subversion 服务器
一.准备工作 1.获取 Subversion 服务器程序到官方网站(http://subversion.tigris.org/)下载最新的服务器安装程序.目前最新的是1.5版本,具体下载地址在:ht ...
Java调用.Net WebService参数为空解决办法 (远程)调试webservice方法
同事遇到一个很囧的问题,java调,netwebservice的时候,调用无参数方法成功,调用有参数的方法每次我这边的webservice日志都记录参数为空,而我自己.Net程序调用完全没有问题,后面 ...
日志挖掘(logminer)
转. 如何使用logminer分析Oracle 联机日志笔者在工作中经常遇到这样的情况:为了追踪数据的变化,需要知道某个表或者表中的某行数据是什么时候被修改的,以及修改前的内容. ...

Tensorflow图像操作