生成对抗网络(GAN)的18个绝妙应用
https://juejin.im/post/5d3fb44e6fb9a06b2e3ccd4e
生成对抗网络(GAN)是生成模型的一种神经网络架构。
生成模型指在现存样本的基础上,使用模型来生成新案例,比如,基于现存的照片集生成一组与其相似却有细微差异的新照片。
GAN是使用两个神经网络模型训练而成的一种生成模型。其中一个称为“生成器”或“生成网络”模型,可学习生成新的可用案例。另一个称为“判别器”或“判别网络”,可学习判别生成的案例与实际案例。
两种模型(从博弈论的意义上来说)处于一种竞争状态,生成器企图愚弄判别器,而判别器则要同时处理生成案例和实际案例。
经学习,生成模型可生成所需的新案例。
生成对抗网络具有极为具体的使用案例,一开始这些案例理解起来会有些困难。
本文将回顾大量GAN的有趣应用,有助于你了解其能够解决的案例类型。以下列表或许并不完整,但其中包含了许多媒体介绍过的GAN使用案例。
应用案例可划分为以下18种类型:
- 生成图像数据集案例
2014年,Ian Goodfellow等人发表论文《对抗式生成网络》,提出了生成新案例这一应用。文中指出,GAN可为MNIST手写数码数据集、CIFAR-10小件图片数据集、多伦多人像数据集生成新案例。
论文传送门:https://arxiv.org/abs/1406.2661
GAN可为图像数据集生成新案例。图片来自《生成对抗网络》。
2015年,Alec Radford等人在一篇重要论文《使用深度回旋生成对抗网络进行无监督表示学习》,也表达了类似观点。论文指出,深度回旋生成对抗网络展示了大规模培养稳定GAN的方法。论文展示了生成卧室新案例的模型。
论文传送门:https://arxiv.org/abs/1511.06434
GAN根据图像数据集生成的卧室新案例。图片来自《生成对抗网络》。
同时,论文展示了GAN(在潜在空间中)运行向量运算的能力,只需输入生成的卧室案例和人像案例即可。
GAN进行向量运算的案例。图片来自《使用深度回旋生成对抗网络进行无监督表示学习》。
- 生成人脸照片
Tero Karras等人在2017年发表的论文《GAN质量、稳定性及变化性的提高》展示了生成人脸照片的案例,照片十分逼真。因此,论文引起了媒体的广泛关注。生成照片时以名人的脸作为输入,导致生成的案例具有名人的脸部特征,让人感觉很熟悉,却并不认识。
论文传送门:https://arxiv.org/abs/1710.10196
GAN生成人脸照片的案例。图片来自《GAN质量、稳定性及变化性的提高》。
该方法同样用于生成物品和场景案例。
GAN生成物品和场景的案例。图片来自《GAN质量、稳定性及变化性的提高》。
2018年发表的报告《人工智能的恶意使用:预测、预防及抑制》选用的也是以上案例,显示了2014至2017年GAN的快速发展。
论文传送门:https://arxiv.org/abs/1802.07228
2014至2017年GAN的快速发展。图片来自《人工智能的恶意使用:预测、预防及抑制》。
- 生成现实照片
Andrew Brock等人在2018年发表了题为《用于高保真自然图像合成的GAN规模化训练》的论文。论文展现了用BigGAN技术生成合成照片的案例。案例照片几乎与真实照片无异。
论文传送门:https://arxiv.org/abs/1809.11096
用BigGAN技术生成合成照片的案例。图片来自《用于高保真自然图像合成的GAN规模化训练》。
- 生成动画角色
金杨华(音译)等人于2017年发表了题为《用GAN生成动画角色》的论文。论文展示了如何训练及应用GAN来生成动画头像(如日本动漫人物)。
论文传送门:https://arxiv.org/abs/1708.05509
GAN生成动画人脸的案例。图片来自《用GAN生成动画人物》。
受动画角色案例的启发,一些人试图利用GAN生成Pokemon这样的角色,比如pokeGAN项目和使用深度回旋GAN生成Pokemon项目。但目前成效甚微。
GAN生成口袋妖怪角色案例。图片来自pokeGAN项目。
- 图像转换
GAN在这方面几乎无所不能,因为相关论文显示GAN可以执行许多图像转换任务。
Phillip Isola等人于2016年发表题为《使用GAN技术进行图像转换》的论文。论文特别介绍了如何使用GAN的pix2pix技术进行图像转换。
论文传送门:https://arxiv.org/abs/1611.07004
以下是一些图像转换案例:
· 将语义图像转化成城市和建筑景观图片
· 将卫星图像转化成谷歌地图
· 将白天景观转化成夜晚景观
· 将黑白图片转化成彩色图片
· 将素描转化成彩色图片
使用pix2pix技术进行图片日夜转换的案例。图片来自《使用GAN技术进行图像转换》。
使用pix2pix技术将素描转化成彩色图片。图片来自《使用GAN技术进行图片转化》。
朱俊彦等人于2017年发表题为《使用一致循环生成网络进行非配对图像转换》的论文。论文介绍了著名的CycleGAN技术以及大量图片转化的案例。
论文传送门:https://arxiv.org/abs/1703.10593
以下是一些图像转换案例:
· 将图片转化成艺术绘画风格
· 将马的图片转化成斑马图
· 将夏景转化成冬景
· 将卫星图转化成谷歌地图
使用CycleGAN技术进行图片转化的四个案例。图片来自《使用一致循环生成网络进行非配对图片转化》。
论文还介绍了其它案例,如:
· 将画作转化成图片
· 将素描转化成图片
· 将苹果图转化成橙子图
· 将照片转化成艺术画作
使用CycleGAN技术将画作转化成照片的案例。图片来自《使用一致循环生成网络进行非配对图片转化》。
- 文字-图片转化
Han Zhang等人于2016年发表题为《StackGAN:使用堆叠GAN技术进行文字-图片转化及合成》的论文。论文特别介绍了如何运用StackGAN将对于简单物体(如花鸟)的文字描述转化为现实图片。
论文传送门:https://arxiv.org/abs/1612.03242
将鸟类文本描述转化成现实图片的案例。图片来自《StackGAN:使用堆叠GAN技术进行文字转图片转化及合成》。
Scott Reed等人于2016年发表了题为《使用GAN技术合成图像》的论文。论文介绍了把对花、鸟等物体的文本描述转化为图像的案例。
论文传送门:https://arxiv.org/abs/1605.05396
将花鸟文本描述转化成现实图片的案例。图片来自《使用GAN技术合成图片》。
Ayushmen Dash等人于2017年发表了题为《TAC-GAN——受文本限制的辅助分类器GAN》的论文。文中介绍了几近相同的数据集案例。
论文传送门:https://arxiv.org/abs/1703.06412
Scott Reed等人于2016年发表了题为《学习绘画内容和地点》的论文。论文对GAN的此功能作了进一步介绍,并运用GAN完成文图转化,以及运用包围盒和关键点推测描绘物体(如一只鸟)的位置。
论文传送门:https://arxiv.org/abs/1610.02454
文图转化的案例及GAN提供的位置信息。图片来自《学习绘画内容和地点》。
- 语义图像-图片转化
Ting-Chun Wang等人于2017年发表了题为《使用条件性GAN进行高清图片合成及语义操纵》的论文。文中介绍了使用条件性GAN根据语义图像或素描生成现实图片的方法。
论文传送门:https://arxiv.org/abs/1711.11585
语义图像及GAN生成城市景观照片的案例。图片来自《使用条件性GAN合成高保真图片及语义操纵》。
具体案例如下:
· 根据语义图像合成城市景观图片
· 根据语义图像合成卧室图片
· 根据语义图像合成人脸图片
· 根据素描合成人脸图片
论文同时介绍了一种可操纵所生成图片的互动编辑器。
- 生成正面人像图片
Rui Huang等人于2017年发表了题为《人脸转正:全球及地方GAN感知合成拟真正面人像图片》的论文。文中介绍了使用GAN根据特定角度的人脸生成正面人像图片(如脸朝前)的方法。此类技术可应用于人脸验证或辨认系统。
使用GAN生成正面人像的案例。图片来自《人脸转正:使用全球及地方GAN感知合成拟真正面人像图片》。
- 生成新体态
Liqian Ma等人于2017年发表了题为《人体体态图像生成》的论文。文中介绍了生成人体模型新体态的案例。
论文传送门:https://arxiv.org/abs/1705.09368
人体模型新体态的案例。图片来自《人体体态图像生成》。
- 图片转表情
Yaniv Taigman等人于2016年发表了《无监督跨领域图像生成》一文介绍了使用GAN跨领域转化图像的方法。比如,将街区数字转化为MNIST手写数码,或将名人照片转化为emoji或动画表情。
论文传送门:https://arxiv.org/abs/1611.02200
将名人照片转化为emoji表情的案例。图片来自《无监督跨领域图像生成》。
- 图片编辑
Guim Perarnau等人于2016年发表了题为《使用可逆条件性GAN编辑图片》的论文。文中特别介绍了使用GAN的IcGAN技术根据特定的面部特征如发色、发型、表情甚至性别变化来重建人像图片的方法,比如:
使用IcGAN技术编辑人脸图片的案例。图片来自《使用可逆条件性GAN编辑图片》。
论文传送门:https://arxiv.org/abs/1611.06355
Ming-Yu Liu等人于2016年发表了题为《耦合性GAN》的论文。文中同样介绍了如何利用发色、表情和眼镜等特征生成面部图片。论文同时也展示了其他图像的生成,如有颜色和深度变化的场景图片。
论文传送门:https://arxiv.org/abs/1606.07536
使用GAN生成有或无金发的人像图片案例。图片来自《耦合性GAN》。
Andrew Brock等人于2016年发表了题为《使用IAN进行神经图片编辑》的论文。文中介绍了一种运用多种变化性自动编码器及GAN的面部照片编辑器。此种编辑器可以快速对人脸特征进行修改,包括修改发色、发型、表情、体态,以及增补面部胡须。
论文传送门:https://arxiv.org/abs/1609.07093
基于VAE和GAN使用神经图片编辑器修改面部特征的案例。图片来自《使用IAN进行神经图片编辑》。
He Zhang等人于2017年发表了题为《使用条件性GAN消除图片中的雨》的论文。文中介绍了如何使用GAN编辑图片,比如消除图片中的雨雪。
论文传送门:https://arxiv.org/abs/1701.05957
使用GAN消除图片中的雨的案例。图片来自《使用条件性GAN消除图片中的雨》。
- 面部老化
Grigory Antipov等人于2017年发表了题为《使用条件性GAN进行面部老化处理》的论文。文中介绍了使用GAN生成不同年龄段人脸图片的方法。
论文传送门:https://ieeexplore.ieee.org/document/8296650
使用GAN生成不同年龄段的人脸图片的案例。图片来自《使用条件性GAN进行面部老化》。
Zhifei Zhang等人于2017年发表了题为《使用条件性对抗自动编码器增龄/减龄》的论文。文中介绍了使用GAN对面部图片进行减龄处理的方法。
论文传送门:https://arxiv.org/abs/1702.08423
使用GAN对面部图片进行减龄处理的案例。图片来自《使用条件性对抗自动编码器增龄/减龄》。
- 图片混合
Huikai Wu等人于2017年发表了题为《GP-GAN:关于现实高保真照片的混合》的论文。文中展示了GAN在混合照片,尤其是混合田野、大山及其大型物体照片中的应用。
论文传送门:https://arxiv.org/abs/1703.07195
使用GAN混合图片的案例。图片来自《GP-GAN:关于现实高保真照片的混合》。
- 超分辨率
Christian Ledig等人于2016年发表了题为《使用GAN生成单幅高分辨率图像》的论文。文中特别展示了GAN的SRGAN模型在生成具有超高分辨率图像中的应用。
论文传送门:https://arxiv.org/abs/1609.04802
使用GAN生成超高分辨率图片的案例。图片来自《使用GAN生成高分辨率现实单图》。
Huang Bin等人于2017年发表了题为《使用条件性GAN生成具有高质量、超高分辨率的面部图像》的论文。文中特别展示了GAN在构建不同版本人脸图像中的应用。
论文传送门:https://arxiv.org/abs/1707.00737
生成高分辨率人脸图像的案例。图片来自《使用条件性GAN生成高质量超高分辨率面部图像》。
Subeesh Vasu等人于2018年发表了题为《使用强化超高分辨率感知网络分析扭曲认知的折中参数》的论文。文中展示了一个使用GAN构建街景高分辨率图片的案例。
论文传送门:https://arxiv.org/abs/1811.00344
使用GAN生成高分辨率建筑图片的案例。图片来自于《使用强化超高分辨率感知网络分析扭曲认知的哲衷参数》。
- 图片修复
Deepak Pathak等人于2016年发表了题为《文本编码器:通过图片修复学习特征》的论文。论文特别介绍了如何使用GAN的文本编码器进行图片修复或填充空缺,即填补图片中某块缺失的部分。
论文传送门:https://arxiv.org/abs/1604.07379
使用文本编码器修复图片的案例。图片来自《文本编码器:通过图片修复学习特征》。
Raymond A. Ye等人于2016年发表了题为《使用深度生成模型修复语义图像》的论文。文中介绍了如何用GAN对故意损坏的人脸图像进行填充和修复。
论文传送门:https://arxiv.org/abs/1607.07539
使用GAN修复人脸图像的案例。图片来自《使用深度生成模型修复语义图像》。
Yijun Li等人于2017年发表了题为《人脸图像生成性填充》的论文。文中同样介绍了如何使用GAN对损坏的人脸图像进行修复和重建。
论文传送门:https://arxiv.org/abs/1704.05838
使用GAN重建人脸图像的案例。图片来自《人脸图像生成性填充》。
- 服装转化
Donggeun Yoo等人于2016年发表了题为《像素级领域转化》的论文。论文展示了如何根据身着服装的模特照片,运用GAN生成类似服装图集或线上服装店的服装图片。
论文传送门:https://arxiv.org/abs/1603.07442
输入图片及使用GAN生成服装图片的案例。图片来自《像素级领域转化》。
- 视频预测
Carl Vondrick等人于2016年发表了题为《生成场景动态视频》的论文。文中介绍了如何使用GAN进行视频预测,尤其是连续预测最长可至一秒的视频帧,聚焦于场景中的静态因素。
论文传送门:https://arxiv.org/abs/1609.02612
使用GAN生成视频帧的案例。图片来自《生成场景动态视频》。
- 3D打印
吴佳俊等人于2016年发表了题为《通过3D生成对抗模型学习物体形状的可能潜在空间》的论文。论文展示了如何使用GAN生成物体的3D模型,比如桌椅、汽车和沙发。
论文传送门:https://arxiv.org/abs/1610.07584
使用GAN生成3D模型的案例。图片来自《通过3D生成对抗模型学习物体形状的可能潜在空间》。
Matheus Gadelha等人于2016年发表了题为《由2D物体视图推导3D形状》的论文。文中介绍了如何使用GAN根据多种视角的2D物体图像生成3D模型。
论文传送门:https://arxiv.org/abs/1612.05872
由2D椅子视图重建其3D模型的案例。图片来自由《2D物体视图推导3D形状》。
生成对抗网络(GAN)的18个绝妙应用的更多相关文章
- 用MXNet实现mnist的生成对抗网络(GAN)
用MXNet实现mnist的生成对抗网络(GAN) 生成式对抗网络(Generative Adversarial Network,简称GAN)由一个生成网络与一个判别网络组成.生成网络从潜在空间(la ...
- TensorFlow从1到2(十二)生成对抗网络GAN和图片自动生成
生成对抗网络的概念 上一篇中介绍的VAE自动编码器具备了一定程度的创造特征,能够"无中生有"的由一组随机数向量生成手写字符的图片. 这个"创造能力"我们在模型中 ...
- 人工智能中小样本问题相关的系列模型演变及学习笔记(二):生成对抗网络 GAN
[说在前面]本人博客新手一枚,象牙塔的老白,职业场的小白.以下内容仅为个人见解,欢迎批评指正,不喜勿喷![握手][握手] [再啰嗦一下]本文衔接上一个随笔:人工智能中小样本问题相关的系列模型演变及学习 ...
- 生成对抗网络GAN介绍
GAN原理 生成对抗网络GAN由生成器和判别器两部分组成: 判别器是常规的神经网络分类器,一半时间判别器接收来自训练数据中的真实图像,另一半时间收到来自生成器中的虚假图像.训练判别器使得对于真实图像, ...
- 科普 | 生成对抗网络(GAN)的发展史
来源:https://en.wikipedia.org/wiki/Edmond_de_Belamy 五年前,Generative Adversarial Networks(GANs)在深度学习领域掀起 ...
- 生成对抗网络(GAN)
基本思想 GAN全称生成对抗网络,是生成模型的一种,而他的训练则是处于一种对抗博弈状态中的. 譬如:我要升职加薪,你领导力还不行,我现在领导力有了要升职加薪,你执行力还不行,我现在执行力有了要升职加薪 ...
- 深度学习-生成对抗网络GAN笔记
生成对抗网络(GAN)由2个重要的部分构成: 生成器G(Generator):通过机器生成数据(大部分情况下是图像),目的是“骗过”判别器 判别器D(Discriminator):判断这张图像是真实的 ...
- 深度学习框架PyTorch一书的学习-第七章-生成对抗网络(GAN)
参考:https://github.com/chenyuntc/pytorch-book/tree/v1.0/chapter7-GAN生成动漫头像 GAN解决了非监督学习中的著名问题:给定一批样本,训 ...
- 利用tensorflow训练简单的生成对抗网络GAN
对抗网络是14年Goodfellow Ian在论文Generative Adversarial Nets中提出来的. 原理方面,对抗网络可以简单归纳为一个生成器(generator)和一个判断器(di ...
- 原始的生成对抗网络GAN
论文地址:https://arxiv.org/pdf/1406.2661.pdf 1.简介: GAN的两个模型 判别模型:就是图中右半部分的网络,直观来看就是一个简单的神经网络结构,输入就是一副图像, ...
随机推荐
- 從nasm assembly看函數參數傳遞
在淘宝定了<<C++程序设计语言(特别版)>> 后天才能到货.从网上下了<<C++ Primer中文版>>的电子书看看.找找C++的感觉先. 先看看基本 ...
- springboot整合jsp 遇到的问题
1,在idea中新建jsp文件 首先需要在springboot项目 在src 中webapp /WEB-INF/JSP 当我右键想新建一个jsp文件时默认没有 File->Project Str ...
- 微信小程序の页面路由
微信小程序的页面路由由平台已栈的形式管理. 微信小程序的页面为什么会如此特殊呢,因为可视区域始终只有一个页面. 一.小程序页面的路由方式 小程序页面有6种路由方式:初始化.打开新页面.页面重定向.页面 ...
- shell数组变量
- Git版本控制及gitlab私有仓库
Git版本控制系统 版本控制系统简介 版本控制系统是一种记录一个或若干个文件内容变化,以便将来查阅特定版本内容情况的系统 记录文件的所有历史变化 随时恢复到任何一个历史状态 多人协作开发 常见版本管理 ...
- 计算机网络之IP地址与MAC地址
IP地址 IP地址(Internet Protocol Address): 缩写为IP Adress,是一种在Internet上的给主机统一编址的地址格式,也称为网络协议(IP协议)地址. 它为互联网 ...
- BZOJ 2055: 80人环游世界(有上下界的费用流)
题面 Time Limit: 10 Sec Memory Limit: 64 MB Submit: 693 Solved: 434 [Submit][Status][Discuss] Descript ...
- CF 1076E Vasya and a Tree(线段树+树剖)
传送门 解题思路 首先按照每个修改时\(x\)的深度\(+d\)从大到小排序,然后按照深度分层,一层一层的修改,修改的时候就直接暴力修改子树,然后每做完一层把答案都取下来,因为以后的所有修改的深度都小 ...
- eclipse中svn的各种图标详解
参考:http://blog.sina.com.cn/s/blog_637810b101018xw0.html - 已忽略版本控制的文件.可以通过Window → Preferences → Team ...
- 如何在普通用户权限cmd怎么使用命令行变为管理员权限
这两天在弄MySql,由于我下载的是免安装版本,环境自己配置了一下.有强迫症不喜欢某些服务打开在我不需要的时候,我一般都设置为手动,但是每次使用数据库时都要使用net start mysql启动MyS ...