论文笔记之：DualGAN: Unsupervised Dual Learning for Image-to-Image Translation

DualGAN: Unsupervised Dual Learning for Image-to-Image Translation

2017-06-12 21:29:06

　　引言部分：

　　本文提出一种对偶学习模式的 GAN 网络结构来进行 image to image translation。现有的图像之间转换的方法，大部分都是需要图像对的方法，但是实际上有的场景下，很难得到这样的图像对。如何利用多个 domain 之间的关系，不需要图像对就可以进行图像之间的转换，那将会是一个很 cool 的工作，而本文就是将 GAN 和 Dualing Learning 结合起来完成了该项目，从效果来看，还是可以的。

　　关于 Dualing Learning：

　　主要是参考了 NIPS 2016 年的一篇文章，做机器翻译的。是想将 domain A 到 domain B 之间的转换，构成一个闭环（loop）。通过 minimize 该图和重构图像之间的 loss 来优化学习的目标。这里也是，给定一个 domain image A，用一个产生器 P 来生成对应的 domain image B，由于没有和A匹配的图像对，这里是没有 GT 的。那么如何衡量产生器造出的图像 P(A, z) 的质量呢？如何该图伪造的很好，那么反过来，用另一个产生器 Q，应该可以很好的恢复出该图，即：Q(P(A, z), z') 应该和 A 是类似的，即：|| Q(P(A, z), z') - A ||。对于 domain image B 也是如此，那么有了另一个重构误差。

　　这样，除了在 minimize 两个产生器的loss的同时，也需要考虑到这两个重构误差，从而使得最终转换的结果有保证。

　　==>> Training Target:

　　1. 用 L1 loss 来尽可能使得图像清晰；

　　2. 用两个 GAN 来实现 domain 之间的切换；

论文笔记之：DualGAN: Unsupervised Dual Learning for Image-to-Image Translation的更多相关文章

论文笔记之：UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS
UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS ICLR 2 ...
论文笔记(2)：A fast learning algorithm for deep belief nets.
论文笔记(2):A fast learning algorithm for deep belief nets. 这几天继续学习一篇论文,Hinton的A Fast Learning Algorithm ...
【论文笔记】DeepOrigin: End-to-End Deep Learning for Detection of New Malware Families
DeepOrigin: End-to-End Deep Learning for Detection of New Malware Families 标签(空格分隔): 论文论文基本信息会议: I ...
论文笔记 - An Explanation of In-context Learning as Implicit Bayesian Inference
这位更是重量级.这篇论文对于概率论学的一塌糊涂的我简直是灾难. 由于 prompt 的分布与预训练的分布不匹配(预训练的语料是自然语言,而 prompt 是由人为挑选的几个样本拼接而成,是不自然的自然 ...
论文笔记之： Deep Metric Learning via Lifted Structured Feature Embedding
Deep Metric Learning via Lifted Structured Feature Embedding CVPR 2016 摘要:本文提出一种距离度量的方法,充分的发挥 traini ...
论文笔记之：Deep Reinforcement Learning with Double Q-learning
Deep Reinforcement Learning with Double Q-learning Google DeepMind Abstract 主流的 Q-learning 算法过高的估计在特 ...
SfMLearner论文笔记——Unsupervised Learning of Depth and Ego-Motion from Video
1. Abstract 提出了一种无监督单目深度估计和相机运动估计的框架利用视觉合成作为监督信息,使用端到端的方式学习网络分为两部分(严格意义上是三个) 单目深度估计多视图姿态估计解释性网络( ...
Deep Learning论文笔记之（八）Deep Learning最新综述
Deep Learning论文笔记之(八)Deep Learning最新综述 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感觉看完 ...
Deep Learning论文笔记之（三）单层非监督学习网络分析
Deep Learning论文笔记之(三)单层非监督学习网络分析 zouxy09@qq.com http://blog.csdn.net/zouxy09 自己平时看了一些论文,但老感 ...

随机推荐

Fantasia (点强连通分量建图 + 树形DP)
简化一下题意,我们先看成一副强连通的图,这时候应该是最简单了,去点任意点都是其他的乘积.那再加强一点难度,改为两个强连通图连接的非强连通图呢?那应该就是找出关键的那个点,并求出两边的乘积.但是一个一个 ...
PowMod (欧拉推式子 + 指数循环节)
最主要的步骤是用 1式子和2式子推 3式子.(难点,看了很多博客最后的时候那个式子看不懂) 当n, m互质时即gcd(n, m) == 1,存在phi(n * m) = phi(m) * phi(n) ...
tft屏图像文字一起显示
2010-05-04 21:06:00 M16内部flash只有16k,要做数码相框,只能用usart通信了.明天继续研究.
GUI颜色、字体设置对话框
%颜色设置对话框 uisetcolor %c 红色 c=uisetcolor %默认规定颜色 c=uisetcolor([ ]); %设置曲线颜色 h = plot([:]); c = uisetco ...
Java常用API、Math类介绍
一.API的概述 API——Application Programing Interface:应用程序编程接口,是java提供的一些预定义的函数: 目的:基于API实现程序的快速编写,只需了解其作用, ...
mysql安装登录
接下来就开始安装mysql 下载地址:http://dev.mysql.com/downloads/mysql/ 选择 dmg格式下载完毕后,双击打开dmg文件,双击 “mysql-5.7.9-o ...
GO语言学习笔记之Linux环境下安装GO语言
0x00 安装环境和GO版本本篇是源码安装,非使用包管理工具安装. # Centos 7.4 # GO v1.11.2 0x01 下载GO安装包 # wget https://dl.google.c ...
windows下vc编译和debug nginx
总体来说,各个步骤以及版本参考官方文档http://nginx.org/en/docs/howto_build_on_win32.html一点没错,有些细节没说清楚. To build nginx: ...
【题解】Luogu P1972 [SDOI2009]HH的项链
原题传送门莫队入门题我博客里对莫队的介绍很多人说这题卡莫队,但窝随便写了一个程序就过了qaq(虽说开了氧化) 我们在排序询问时,普通是这样qaq inline bool cmp(register ...
Redis随笔-rename效率问题
背景 rename是redis中给key重命名命令,rename key newkey的意思就是将key重命名为newkey.大部分文档在介绍rename的时候只将它描述成一个时间复杂度为O(1)的命 ...

论文笔记之：DualGAN: Unsupervised Dual Learning for Image-to-Image Translation

论文笔记之：DualGAN: Unsupervised Dual Learning for Image-to-Image Translation的更多相关文章

随机推荐

热门专题