语音合成论文翻译：2019_MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis

论文地址:MelGAN:条件波形合成的生成对抗网络代码地址:https://github.com/descriptinc/melgan-neurips 音频实例:https://melgan-neurips.github.io/ 配有MelGAN解码器的音乐翻译网络:https://www.descript.com/overdub 摘要以前的工作(Donahue等人,2018a:Engel等人,2019a)已经发现用GAN生成相干的原始音频波形是一个挑战.在本文中,我们证明了通过引入一系列结…

StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation - 1 - 多个域间的图像翻译论文学习

Abstract 最近在两个领域上的图像翻译研究取得了显著的成果.但是在处理多于两个领域的问题上,现存的方法在尺度和鲁棒性上还是有所欠缺,因为需要为每个图像域对单独训练不同的模型.为了解决该问题,我们提出了StarGAN方法,这是一个新型的可扩展的方法,能够仅使用一个单一模型就实现多领域的图像翻译.StarGAN这样的统一模型的结构允许在单个网络上同时训练带有不同领域的多个数据集.这使得StarGAN的翻译图像质量优于现有的模型,并具有将输入图像灵活地翻译到任意目标域的新能力.通过实验,验证了该…

Generative Adversarial Networks,gan论文的畅想

前天看完Generative Adversarial Networks的论文,不知道有什么用处,总想着机器生成的数据会有机器的局限性,所以百度看了一些别人的看法和观点,可能我是机器学习小白吧,看完之后感触还挺多的,我们可以gan: 1.生成一个图片.诗词,比如中国山水画.假设给一个命题‘思乡’,让机器人和一个诗人.画家在比赛,然后对比画的是什么 2.用在nlp,可以搞一个在线学习的机器人,每天去听别人讲话,同时自己尝试声成对话,这样不断优化机器人的口音之类的, 这样,有一天它还真的讲话和人类一…

SAGAN:Self-Attention Generative Adversarial Networks - 1 - 论文学习

Abstract 在这篇论文中,我们提出了自注意生成对抗网络(SAGAN),它是用于图像生成任务的允许注意力驱动的.长距离依赖的建模.传统的卷积GANs只根据低分辨率图上的空间局部点生成高分辨率细节.在SAGAN中,可以使用来自所有特征位置的线索生成细节.此外,判别器可以检查图像中较远部分的细节特征是否一致.此外,最近的研究表明,生成器条件会影响GAN的性能.利用这一观点,我们将光谱归一化应用到GAN生成器上,发现这改善了训练的动态.提出的SAGAN比以前的研究的效果更好,在ImageNet数据…

论文解读（GAN）《Generative Adversarial Networks》

Paper Information Title:<Generative Adversarial Networks>Authors:Ian J. Goodfellow, Jean Pouget-Abadie, M. Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron C. Courville, Yoshua BengioSources:2014, NIPSOther:26700 Citations, 41 ReferencesCode…

《Generative Adversarial Networks for Hyperspectral Image Classification 》论文笔记

论文题目:<Generative Adversarial Networks for Hyperspectral Image Classification> 论文作者:Lin Zhu, Yushi Chen, Member, IEEE, Pedram Ghamisi, Member, IEEE, and Jó n Atli Benediktsson, Fellow, IEEE 论文发表时间:2018 网络简称:3D-GAN 发表期刊:IEEE Transactions on Geoscience…

StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks 论文笔记

StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks 本文将利用 GANs 进行高质量图像生成,分为两个阶段进行,coarse to fine 的过程.据说可以生成 256*256 的高清图像. 基于文本生成对应图像的工作已经有了,比如说 Attribute2Image,以及最开始的基于文本生成图像的文章等等. Stacked Generated Adver…

论文笔记之：Semi-Supervised Learning with Generative Adversarial Networks

Semi-Supervised Learning with Generative Adversarial Networks 引言:本文将产生式对抗网络(GAN)拓展到半监督学习,通过强制判别器来输出类别标签.我们在一个数据集上训练一个产生式模型 G 以及一个判别器 D,输入是N类当中的一个.在训练的时候,D被用于预测输入是属于 N+1的哪一个,这个+1是对应了G的输出.这种方法可以用于创造更加有效的分类器,并且可以比普通的GAN 产生更加高质量的样本. 将产生式模型应用于半监督学习并非一个新颖…

论文笔记之：UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS

UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS ICLR 2016 摘要:近年来 CNN 在监督学习领域的巨大成功和无监督学习领域的无人问津形成了鲜明的对比,本文旨在链接上这两者之间的缺口.提出了一种 deep convolutional generative adversarial networks (DCGANs),that have certai…

生成对抗网络（Generative Adversarial Networks，GAN）初探

1. 从纳什均衡(Nash equilibrium)说起我们先来看看纳什均衡的经济学定义: 所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处.换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡. B站上有一个关于”海滩2个兄弟卖雪糕“形成纳什均衡的视频,讲的很生动. 不管系统中的双方一开始处于什么样的状态,只要系统中参与竞争的个体都是”理性经济人“,即每个人在考虑其他人的可能动作的基…

Generative Adversarial Networks overview（2）

Libo1575899134@outlook.com Libo (原创文章,转发请注明作者) 本文章会先从Gan的简单应用示例讲起,从三个方面问题以及解决思路覆盖25篇GAN论文,第二个大部分会进一步讲Gan的所有领域应用 ----------------------------------------------------------------------------------- 上一篇说到最近有人关于encoder给出了更加直观的解释: 从另一个角度理解,传统的A是我们希望的map,两…

《Self-Attention Generative Adversarial Networks》里的注意力计算

前天看了 criss-cross 里的注意力模型仔细理解了在: https://www.cnblogs.com/yjphhw/p/10750797.html 今天又看了一个注意力模型 <Self-Attention Generative Adversarial Networks> https://arxiv.org/pdf/1805.08318v1.pdf 里边关键的还是注意力机制,又花了一个小时理解了下,感觉这种方式能够带来另一种视野的扩大,其中cnn是通过不断卷积扩大视野. 而…

Perceptual Generative Adversarial Networks for Small Object Detection

Perceptual Generative Adversarial Networks for Small Object Detection 感知生成对抗网络用于目标检测论文链接:https://arxiv.org/pdf/1706.05274.pdf 论文作者:Jianan Li Xiaodan Liang Yunchao Wei Tingfa Xu Jiashi Feng Shuicheng Yan 论文级别:CVPR 2017 摘要小目标检测非常具有挑战性,因为小目标具有低分辨率和噪点存…

Generative Adversarial Networks overview（1）

Libo1575899134@outlook.com Libo (原创文章,转发请注明作者) 本文章会先从Gan的简单应用示例讲起,从三个方面问题以及解决思路覆盖25篇GAN论文,第二个大部分会进一步讲Gan的所有领域应用 ----------------------------------------------------------------------------------- 1: 下图GAN可以学到不同的字体,并且在字体之间进行不同的变换 2 下图可以用简笔画可以用GAN帮助生成想…

生成对抗网络（Generative Adversarial Networks, GAN）

生成对抗网络(Generative Adversarial Networks, GAN)是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的学习方法之一. GAN 主要包括了两个部分,即生成器 generator 与判别器 discriminator.生成器主要用来学习真实图像分布从而让自身生成的图像更加真实,以骗过判别器.判别器则需要对接收的图片进行真假判别.在整个过程中,生成器努力地让生成的图像更加真实,而判别器则努力地去识别出图像的真假,这个过程相当于一个二人博弈,随着时间的…

论文翻译：2020_Generative Adversarial Network based Acoustic Echo Cancellation

论文地址:http://www.interspeech2020.org/uploadfile/pdf/Thu-1-10-5.pdf 基于GAN的回声消除摘要生成对抗网络(GANs)已成为语音增强(如噪声抑制)中的热门研究主题.通过在对抗性场景中训练噪声抑制算法,基于GAN的解决方案通常会产生良好的性能.在本文中,提出了卷积循环GAN架构(CRGAN-EC),以解决线性和非线性回声情况.所提出的体系结构在频域中进行了训练,并预测了目标语音的时频(TF)掩码.部署了几种度量损失函数,并研究了它们…

Paper Reading: Perceptual Generative Adversarial Networks for Small Object Detection

Perceptual Generative Adversarial Networks for Small Object Detection 2017-07-11 19:47:46 CVPR 2017 This paper use GAN to handle the issue of small object detection which is a very hard problem in general object detection. As shown in the followin…

（转）Introductory guide to Generative Adversarial Networks (GANs) and their promise!

Introductory guide to Generative Adversarial Networks (GANs) and their promise! Introduction Neural Networks have made great progress. They now recognize images and voice at levels comparable to humans. They are also able to understand natural langua…

SalGAN: Visual saliency prediction with generative adversarial networks

SalGAN: Visual saliency prediction with generative adversarial networks 2017-03-17 摘要:本文引入了对抗网络的对抗训练机制来进行显著性物体的预测.虽然我们老板很不喜欢显著性,但是,做显著性检测的人还是会说:这是有意义的.如本文说的:恩,显著性可以作为 soft-attention,来引导其他计算机视觉任务的进行,也可以直接引导 marketing 领域. 本文区别于其他方法最显著的地方在于:the usage of…

【文献阅读】Perceptual Generative Adversarial Networks for Small Object Detection –CVPR-2017

Perceptual Generative Adversarial Networks for Small Object Detection 2017CVPR 新鲜出炉的paper,这是针对small object detection的一篇文章,采用PGAN来提升small object detection任务的performance. 最近也没做object detection,只是别人推荐了这篇paper,看了摘要觉得通俗易懂就往下看了...最后发现还是没怎么搞懂,只是明白PGAN的模型.如果…

GD-GAN: Generative Adversarial Networks for Trajectory Prediction and Group Detection in Crowds

GD-GAN: Generative Adversarial Networks for Trajectory Prediction and Group Detection in Crowds 2019-09-24 10:16:03 Paper: https://arxiv.org/pdf/1812.07667.pdf Demo video: https://www.youtube.com/watch?v=7cCIC_JIfms 本文提出一种基于产生式对抗网络的联合方法来进行轨迹预测和团伙检测.…

Social GAN: Socially Acceptable Trajectories with Generative Adversarial Networks

Social GAN: Socially Acceptable Trajectories with Generative Adversarial Networks 2019-06-01 09:52:46 Paper: http://openaccess.thecvf.com/content_cvpr_2018/papers/Gupta_Social_GAN_Socially_CVPR_2018_paper.pdf Code: https://github.com/agrimgupta92/sga…

AttnGAN: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networks 笔记

AttnGAN: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networks 笔记这篇文章的任务是 "根据文本描述" 生成图像.以往的常规做法是将整个句子编码为condition向量,与随机采样的高斯噪音\(z\)进行拼接,经过卷积神经网络(GAN,变分自编码等)来上采样生成图像.这篇文章发现的问题是:仅通过编码整个句子去生成图像会忽略掉一些细粒度的信息,而这些细粒度的信…

文献阅读报告 - Social GAN: Socially Acceptable Trajectories with Generative Adversarial Networks

paper:Gupta A , Johnson J , Fei-Fei L , et al. Social GAN: Socially Acceptable Trajectories with Generative Adversarial Networks[J]. 2018. code:https://github.com/agrimgupta92/sgan 概览文章提出了一种采用GAN架构进行训练的轨迹预测模型,Generator由Encoder-Decoder结构组成,Discrimina…

Contrastive Generative Adversarial Networks

目录概主要内容代码 Kang M., Park J. Contrastive Generative Adversarial Networks. arXiv preprint arXiv 2006.12681, 2020. 概如何将对比损失和GAN结合在一起呢? 主要内容还是老问题, 结合对比学习就是如何构造正负样本的问题. 首先看图c, 本文ContraGAN提取特征的方式为\(D_{\phi_1}(x)\), 这部分是判别器的encoder部分, 即除最后一个全连接层的部分. 之后再…

CIAGAN: Conditional Identity Anonymization Generative Adversarial Networks阅读笔记

CIAGAN: Conditional Identity Anonymization Generative Adversarial Networks 2020 CVPR 2005.09544.pdf (arxiv.org) (个人理解,欢迎指正错误) Introduction 隐私:整个人脸可用性:是看起来自然的人文章去除真实人脸的同时生成了高质量的假人脸,可用于支持跟踪.检测等计算机视觉任务.与先前工作相比,本文的创新处在于可以在一定程度上控制人脸匿名效果,依据给定的身份参照指导假人脸…

《MuseGAN: Multi-track Sequential Generative Adversarial Networks for Symbolic Music Generation and Accompaniment》论文阅读笔记

出处:2018 AAAI SourceCode:https://github.com/salu133445/musegan abstract: (写得不错值得借鉴)重点阐述了生成音乐和生成图片,视频及语音的不同.首先音乐是基于时间序列的:其次音符在和弦.琶音(arpeggios).旋律.复音等规则的控制之下的:同时一首歌曲是多track的.总之不能简单堆叠音符.本文基于GAN提出了三种模型来生成音乐:jamming model, the composer model and the hybri…

GAN（Generative Adversarial Networks）初步

1. Generator vs. Discriminator 首先需要指出的是生成式模型(generative models)和判别式模型(discriminative models)的区别: discriminative models:根据训练样本直接学习 p(y|x) generative models:首先学习特征向量与标签的联合概率分布 p(x,y),再通过贝叶斯规则,转换为 p(y|x) 然后,我们来看GAN整体框架图,从整体上把握GAN的模型设计: GAN 的核心思路在于其模型使用了…

A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications

1 Introduction GANs由两个模型组成:生成器和鉴别器.生成器试图捕获真实示例的分布,以便生成新的数据样本.鉴别器通常是一个二值分类器,尽可能准确地将生成样本与真实样本区分开来.GANs的优化问题是一个极大极小优化问题.优化终止于相对于生成器的最小值和相对于鉴别器的最大值的鞍点. 2.1 Generative algorithms 生成算法可分为两类:显式密度模型和隐式密度模型. 2.1,1 Explicit density model 显式密度模型假设分布,利用真实数据训练包含分…

《StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation》论文笔记

---恢复内容开始--- Motivation 使用单组的生成器G和判别训练图片在多个不同的图片域中进行转换效果确实很逆天,难怪连Good Fellow都亲手给本文点赞 Introduction 论述了Image translating的概念,GAN极大地提升了该领域的生成质量.具体到头像生成任务,作者定义attribute为图片特征(feature),如haircolor,age,gender等:domain被定义为一系列共享了某个属性的图片,如女性图片和男性图片分属不同的domain.该…

【语音合成论文翻译：2019_MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis】的更多相关文章