本文转载自:魔图互联。欢迎访问网站查看详细教程:Tensorflow(pytorch)系列教程

生成对抗网络是深度学习中最有趣和最受欢迎的应用之一。本文将列出 10 篇关于 GAN 的论文,这些论文详细介绍了 GAN,以及了解最新技术的基础。

目录:

  1. DCGAN
  2. Improved Techniques for Training GANs
  3. Conditional GANs
  4. Progressively Growing GANs
  5. BigGAN
  6. StyleGAN
  7. CycleGAN
  8. Pix2Pix
  9. StackGAN
  10. Generative Adversarial Networks

DCGANs (2015)

建议使用 DCGAN 开启您的 GAN 之旅。这篇论文展示了卷积层与 GAN 是怎样组合的,还提供了其他一系列其他的参考架构。论文还讨论了诸如可视化GAN特征,潜在空间插值,用鉴别器特征训练分类器,结果评价等方面,这些方面都会出现在您的 GAN 研究中。总之,DCGAN 论文是必读的 GAN 论文,因为它的结构非常清晰,代码容易使用,可以马上用在您的 GAN 开发中。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LQlUDJmz-1570281194924)(http://qiniu.huizhoujj.cn/1_2NFOGSwW8XCZfMzu2gz-DA.png)]

地址(https://arxiv.org/abs/1511.06434)

Improved Techniques for Training GANs (2016)

这篇论文(作者包括了Ian Goodfellow)提供了一系列的建议,用来建立DCGAN论文中提出的网络结构。这篇论文会帮助您理解GAN不稳定性的最佳假设。此外,本文还提出了许多稳定DCGAN训练的其他技术,包括特征匹配,小批量识别,历史平均,单面标签平滑和虚拟批量标准化。通过这些可以建立一个简单的DCGAN,是一个不错的经历,可帮助更好地理解GAN。

地址(https://arxiv.org/abs/1606.03498)

Conditional GANs (2014)

这是一篇很好的论文。Conditional GANs 是最先进的GAN的核心主题。这篇论文展示了如何整合数据的标签,从而实现更稳定的GAN训练。这种使用先验信息调节GAN的概念在GAN研究的未来工作中是一个反复出现的主题,对于关注图像到图像或文本到图像的论文尤其重要。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IQDSffpd-1570281194924)(http://qiniu.huizhoujj.cn/1_bDTxgALN7bRXMOMSXXfCCA.png)]

地址(https://arxiv.org/abs/1411.1784)

Progressively Growing of GANs for Improved Quality, Stability, and Variation (2017)

由于其令人印象深刻的结果和对GAN问题的创造性方法,这篇论文是必须要阅读一下的。它采用不同层次结构,GAN 分辨率从4²到8²,最高到1024²。相对于目标图像分辨率大小,GAN的不稳定性大大增加,本文就提出了该问题的解决方法。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0tk0qzux-1570281194925)(http://qiniu.huizhoujj.cn/1_-yWq7Pps_0wzRcM-tMOBfQ.png)]

地址(https://arxiv.org/abs/1710.10196)

BigGAN (2019)

BigGAN模型是ImageNet的当前最新技术。这种模型很难在本地机器上实现,并且模型中有许多组件,如自注意力,频谱归一化和带有投影鉴别器的cGAN,这些都在他们的论文中得到了很好的解释。而且论文对当前最新技术的基础论文进行了全面的概述。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-keFu1KRW-1570281194926)(http://qiniu.huizhoujj.cn/1_Sxmw8DbslfqgBVuFe2sUuA.png)]

地址(https://arxiv.org/abs/1809.11096)

StyleGAN (2019)

StyleGAN模型可以说在这方面是最好的,尤其是在隐空间控制中。该模型使用称为自适应实例归一化(AdaIN)的神经风格转移机制来控制隐空间向量z,而不像之前的其他方式。映射网络和AdaIN训练分布在整个生成器模型中的的组合使得自己很难实现,但它仍然值得阅读,它包含了许多有趣的想法。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aJJcJmTI-1570281194926)(http://qiniu.huizhoujj.cn/1_ZXDIjsL3c8y1q53AOPjwQw.png)]

地址(https://arxiv.org/abs/1812.04948)

CycleGAN (2017)

CycleGAN论文与前面提到的6篇论文不同,因为它讨论了图像到图像的迁移问题而不是随机向量的图像合成问题。CycleGAN可以更具体地处理没有配对的图像转换的训练样本。因为循环一致性损失公式的优雅以及如何稳定GAN训练的方式,这是一篇值得阅读的论文。有许多有趣的程序使用CycleGAN,例如超分辨率,风格迁移,让马变为斑马。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0XkipXzN-1570281194926)(http://qiniu.huizhoujj.cn/1_bzUSPC5h6I7QdMgdJD85Pg.png)]

地址(https://arxiv.org/abs/1703.10593)

Pix2Pix (2016)

Pix2Pix是另一种图像到图像转换的GAN模型。该框架使用配对的训练样本,并在GAN模型中使用许多不同的配置。阅读本文时,对我来说最有趣的事情之一就是对PatchGAN的讨论。PatchGAN观察图像的70 x 70区域,以确定它们是真实的还是虚假的,而不是查看整个图像。该模型还提出了一个有趣的U-Net风格生成器结构,以及在生成器模型中使用ResNet样式的跳跃连接。有许多很酷的应用,例如边缘图到照片般真实的图像。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-C7NZrRCC-1570281194927)(http://qiniu.huizhoujj.cn/1_hE0JuFziPLUo-sc1eG0RbA.png)]

地址(https://arxiv.org/abs/1611.07004)

StackGAN (2017)

StackGAN论文与先前的论文相比非常独特。它非常类似于Conditional GANs和Progressively Growing GANs。StackGAN模型的工作方式类似于Progressively Growing GANs,因为它可以在多尺度上工作。StackGAN首先输出64 * 64的图像,然后将其作为先验信息生成256 * 256的图像。StackGAN非常独特,因为它是从自然语言文本到图像的转换。这是通过改变文本嵌入来实现的,以便得到视觉特征。这是一篇非常有趣的论文,看到StyleGAN中展示的潜在空间控制与StackGAN中定义的自然语言接口相结合,令人惊叹。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wf1X7Yjd-1570281194927)(http://qiniu.huizhoujj.cn/1_J0gBWPmkvHgrG75cZiE-0g.png)]

地址(https://arxiv.org/abs/1612.03242)

Generative Adversarial Networks (2014)

Ian Goodfellow的原论文对任何研究GAN的人来说都是必读的。本文定义了GAN框架并讨论了“非饱和”损失函数。本文还给出了最优鉴别器的推导,这是最近GAN论文中经常出现的证明。本文还证明了GAN在实验中对MNIST,TFD和CIFAR-10图像数据集的有效性。

地址(https://arxiv.org/abs/1406.2661)

本文转载自:魔图互联。欢迎访问网站查看详细教程:Tensorflow(Pytorch)系列教程

学习GAN必须阅读的10篇论文的更多相关文章

  1. 京东云与AI 10 篇论文被AAAI 2020 收录,京东科技实力亮相世界舞台

    美国时间2月7-12日,AAAI 2020大会在纽约正式拉开序幕,AAAI作为全球人工智能领域的顶级学术会议,每年评审并收录来自全球最顶尖的学术论文,这些学术研究引领着技术的趋势和未来.京东云与AI在 ...

  2. ICML 2018 | 从强化学习到生成模型:40篇值得一读的论文

    https://blog.csdn.net/y80gDg1/article/details/81463731 感谢阅读腾讯AI Lab微信号第34篇文章.当地时间 7 月 10-15 日,第 35 届 ...

  3. zz2019年主动学习有哪些进展?答案在这三篇论文里

    2019年主动学习有哪些进展?答案在这三篇论文里 目前推广应用的机器学习方法或模型主要解决分类问题,即给定一组数据(文本.图像.视频等),判断数据类别或将同类数据归类等,训练过程依赖于已标注类别的训练 ...

  4. How to Read a Paper丨如何阅读一篇论文

    这是我在看论文时无意刷到的博客推荐的一篇文章"How to Read a Paper",教你怎么样看论文.对于研究生来说,看论文基本是日常,一篇论文十多二十页,如何高效地读论文确实 ...

  5. 转:关于Python中的lambda,这篇阅读量10万+的文章可能是你见过的最完整的讲解

    lambda是Python编程语言中使用频率较高的一个关键字.那么,什么是lambda?它有哪些用法?网上的文章汗牛充栋,可是把这个讲透的文章却不多.这里,我们通过阅读各方资料,总结了关于Python ...

  6. 网易云安全两篇论文入选计算机视觉顶级会议ICCV

    本文由  网易云发布. 10月22日至29日,全球计算机视觉顶尖专家们共聚威尼斯,参加ICCV2017国际计算机视觉大会,就领域内最新成果展开集中研讨,大会论文集也代表了计算机视觉领域最新的发展方向和 ...

  7. PayPal高级工程总监:读完这100篇论文 就能成大数据高手(附论文下载)

    100 open source Big Data architecture papers for data professionals. 读完这100篇论文 就能成大数据高手 作者 白宁超 2016年 ...

  8. jQuery学习笔记 - 基础知识扫盲入门篇

    jQuery学习笔记 - 基础知识扫盲入门篇 2013-06-16 18:42 by 全新时代, 11 阅读, 0 评论, 收藏, 编辑 1.为什么要使用jQuery? 提供了强大的功能函数解决浏览器 ...

  9. (zhuan) 深度学习全网最全学习资料汇总之模型介绍篇

    This blog from : http://weibo.com/ttarticle/p/show?id=2309351000224077630868614681&u=5070353058& ...

随机推荐

  1. JavaScript中prompt的使用

    */ * Copyright (c) 2016,烟台大学计算机与控制工程学院 * All rights reserved. * 文件名:text.js * 作者:常轩 * 微信公众号:Worldhel ...

  2. Web最佳实践阅读总结(2)

    代码符合标准 标准的页面会保证正确的渲染 页面容易被搜索引擎搜索,提高搜索排名(SEO) 提高网站的易用性 网页更好维护和扩展(Validator,HTML Validator 属于Firefox插件 ...

  3. JS面试准备二

    1.常用的字符串方法 1. indexOf:查找字符串某一项的初始位置2. slice:截取字符串(包含起始位置,不包含结束位置) 不会根据参数大小,交换参数位置 如果出现-1按倒数第一个数,如果出现 ...

  4. Asp.Net Core IdentityServer4 中的基本概念

    一.前言 这篇文章可能大家会觉得很空洞,没有实际的实战东西,主要是自己整理出来的IdentityServer4 的一些概念性的东西:如果你对IdentityServer4有过一定的实战经验,可以跳过不 ...

  5. 简单服务器端Blazor Cookie身份验证的演示

    为了演示身份验证如何在服务器端 Blazor 应用程序中工作,我们将把身份验证简化为最基本的元素. 我们将简单地设置一个 cookie,然后读取应用程序中的 cookie. 应用程序身份验证 大多数商 ...

  6. arm 添加 samb 文件共享

    编译环境: ubunto 12 arm-linux-gcc 4.3.2 arm linux 4.1.36 开发板 2440 测试上传速度,大文件 github源码 https://github.com ...

  7. js 实现图片的放大和缩小

    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...

  8. frida(hook工具)的环境搭建

    一.简介 frida 是一款基于 python+javascript 的 hook 框架,可运行在 android.ios.linux.win等各个平台,主要使用的动态二进制插桩技术. Frida官网 ...

  9. Docker Compose 文件讲解

    Docker Compose 是什么 官方文档: Docker Compose是定义和运行多容器 Docker 应用程序的工具.使用"Compose",您可以使用 YAML 文件来 ...

  10. channel的基本使用

    1.管道分类 读写管道 只读管道 只写管道 缓冲通道 :创建时指定大小(如果不指定默认为非缓冲通道) 2.正确使用管道 管道关闭后自能读,不能写 写入管道不能超过管道的容量cap,满容量还写则会阻塞 ...