『TensorFlow』生成式网络中的图片预处理

叠加态的猫 2024-10-15 06:51:33 原文

简介

这里的生成式网络是广义的生成式，不仅仅指gan网络，还有风格迁移中的类自编码器网络，以及语义分割中的类自编码器网络，因为遇到次数比较多，所以简单的记录一下。

背景

1、像素和数字

图像处理目标一般就是RGB三色通道，原始图像解码后是0~255，这个矩阵传给matplotlib就可以直接绘图了，与此同0~1的图像matplotlib也是可以接受的，关于这点，我们来看看文档是怎么说的，

Elements of RGB and RGBA arrays represent pixels of an MxN image.
        All values should be in the range [0 .. 1] for floats or
        [0 .. 255] for integers. Out-of-range values will be clipped to
        these bounds.

即使0~1也能够使用，我们常用的还是0~255的数据。

2、生成式网络输出的限制

生成式网络不同于分类网络，其输出的目标是图像，对照上面也就是0~255范围（这个更常用）的矩阵，这就意味着网络的输出有所限制的，且是不同于分类网络全部限制于0~1或者-1~1的，正如分类网络的sigmoid或者softmax一样，我们会在最后一个卷积/转置卷积层后采取一些操作保证输出满足图像的要求。

实际思路

输入图像为了保证可以被用于loss，需要和输出图像的值域相同，所以有两个思路：

输入图像值压缩到-1~1附近
输出图像值放大到0~255

gan网络中

我们采用方式为：原像素数据除以127.5减去1的操作，使得输出值保持在-1~1之间，可以配合sigmoid激活函数进行学习

实际测试一下，我们将这里的预处理(TFR_process.py)做一下调整，使得值不再被压缩，

'''图像预处理'''

# image_decode = tf.cast(image_decode, tf.float32)/127.5-1

image_decode = tf.cast(image_decode, tf.float32)

相应的将生成网络(DCGAN_function.py)作出调整，

h4 = deconv2d(h3, [batch_size, s_h, s_w, c_dim], scope='g_h4')

return h4  # tf.nn.tanh(h4)

可以看到结果依旧可以训练出来，效果如下。

快速风格迁移中

我们采用0~255作为输入，生成数据仍为0~255（主要分布），然后将输出数据进一步操作，送入vgg进行loss计算。

此时的生成式网络最后一层可以不加激活，输出会自行收敛在目标附近，也可以tanh激活（-1~1）后加1再乘127.5。

『TensorFlow』生成式网络中的图片预处理的更多相关文章

『TensorFlow』专题汇总
TensorFlow:官方文档 TensorFlow:项目地址本篇列出文章对于全零新手不太合适,可以尝试TensorFlow入门系列博客,搭配其他资料进行学习. Keras使用tf.Session训 ...
『TensorFlow』TFR数据预处理探究以及框架搭建
一.TFRecord文件书写效率对比(单线程和多线程对比) 1.准备工作 # Author : Hellcat # Time : 18-1-15 ''' import os os.environ[&q ...
『TensorFlow』DCGAN生成动漫人物头像_下
『TensorFlow』以GAN为例的神经网络类范式『cs231n』通过代码理解gan网络&tensorflow共享变量机制_上『TensorFlow』通过代码理解gan网络_中一.计算 ...
『TensorFlow』滑动平均
滑动平均会为目标变量维护一个影子变量,影子变量不影响原变量的更新维护,但是在测试或者实际预测过程中(非训练时),使用影子变量代替原变量. 1.滑动平均求解对象初始化 ema = tf.train.Ex ...
『TensorFlow』读书笔记_降噪自编码器
『TensorFlow』降噪自编码器设计之前学习过的代码,又敲了一遍,新的收获也还是有的,因为这次注释写的比较详尽,所以再次记录一下,具体的相关知识查阅之前写的文章即可(见上面链接). # Aut ...
『TensorFlow』梯度优化相关
tf.trainable_variables可以得到整个模型中所有trainable=True的Variable,也是自由处理梯度的基础基础梯度操作方法: tf.gradients 用来计算导数.该 ...
『TensorFlow』模型保存和载入方法汇总
『TensorFlow』第七弹_保存&载入会话_霸王回马一.TensorFlow常规模型加载方法保存模型 tf.train.Saver()类,.save(sess, ckpt文件目录)方法 ...
『TensorFlow』第七弹_保存&载入会话_霸王回马
首更: 由于TensorFlow的奇怪形式,所以载入保存的是sess,把会话中当前激活的变量保存下来,所以必须保证(其他网络也要求这个)保存网络和载入网络的结构一致,且变量名称必须一致,这是caffe ...
『TensorFlow』SSD源码学习_其五：TFR数据读取&数据预处理
Fork版本项目地址:SSD 一.TFR数据读取创建slim.dataset.Dataset对象在train_ssd_network.py获取数据操作如下,首先需要slim.dataset.Dat ...

随机推荐

java 之 dom4j解析xml
*dom4j,是一个组织,针对xml解析,提供解析器dom4j *dom4j不是javase的一部分,想要使用需要导入dom4j提供的jar包 *第一步:创建lib文件夹,将压缩文件放到此处 *第二步 ...
LuoguP5221 Product
题目地址题目链接题解注,下方\((i,j)\)均指\(gcd(i,j)\),以及证明过程有一定的跳步,请确保自己会莫比乌斯反演的基本套路. 介绍本题的\(O(n)\)和\(O(n\sqrt{n} ...
Kubernetes命令
kubectl applykubectl getkubectl set image deployment/xxx -n ns echoservice=xxxkubectl deletekubectl ...
Linux学习之用户与root
因为想要建立建立一个目录,但是发现权限不够,因为没用root登陆,所以学习了一下普通用户与root之间如何切换以及如何创建用户的一些知识. 1.pwd命令可以查看当前用户 $这个符号代表的就是普通用户 ...
javascript - 内存空间
也许很多人像我一样,觉得JS有垃圾回收机制,内存就可以不管了,以至于在全局作用域下定义了很多变量,自以为JS会自动回收,直到最近,看了阮一峰老师,关于javascript内存泄漏的文章时,才发现自己写 ...
【BZOJ】3926: [Zjoi2015]诸神眷顾的幻想乡
题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=3926 广义后缀自动机... 久仰公之大名啊... 太阳花田的结构比较特殊,只与一个空地相邻 ...
JaveWeb 公司项目（4）----- Easyui的表单验证
前面三篇博文讲述的是界面的搭建和数据的传输,可以看出目前我做的这个小项目已经有了一个大体的雏形,剩下的就是细节部分的打磨和一些友好的人机交互设计,今天做的是表单的验证,作为初学者,着实花了一番功夫,所 ...
Selenium IDE使用
基于版本Selenium IDE 3.2.2(注:该工具不常用,可以使用定位元素是否存在) Selenium IDE可以录制也很方便,当然录下来的经常回放不成功,需要自己调试就是了.它是只针对Web页 ...
idea中svn的使用教程
引言:以下是idea集成小乌龟后的svn使用教程,一张图足以说明问题,后续如果遇到了比较复杂一点的问题再来补充. 参考文档:https://blog.csdn.net/liuhailiuhai12/a ...
python web py安装与简单使用
web.py是一个轻量级的python web框架,简单而且功能强大.相对flask和Django,web.py更适合初学者来学习和了解web开发的基础知识. 安装: pip install we ...