GAN的前身——VAE模型原理

GAN的前身——VAE模型

今天跟大家说一说VAE模型相关的原理，首先我们从判别模型和生成模型定义开始说起：

判别式模型：已知观察变量X和隐含变量z，它对p(z|X)进行建模，它根据输入的观察变量X得到隐含变量z出现的可能性。

在图像模型中，比如根据原始图像推测图像具备的一些性质，例如根据数字图像推测数字的名称等等图像分类问题。

生成式模型：与判别式模型相反，它对p(X|z)进行建模，输入变量是隐含变量，输出是观察变量的概率。

在图像中，通常是输入图像具备的性质，输出是性质对应的图像。

生成式模型通常用于解决如下问题：

1.构建高维、复杂概率分布，2.数据缺失，3.多模态输出，4.真实输出模型，5.未来数据预测，等系列问题

VAE

在经典的自编码机中，编码网络把原始图像编码卷积成向量，解码网络则能够将向量解码成原始图像，通过使用尽可能多的图像来训练网络，如果保存了某张图像的编码向量，那么就能够随时用解码组建来重建该图像。

那么，问题就来了，潜在向量除了从已有图像中编码得到，能否凭空创造出这些潜在的向量来呢？我们可以这样做，在编码网络中，增加一个约束，使得编码网络所生成的潜在向量大体上服从单位高斯分布。那么，解码器经过训练之后，能是能够解码服从单位高斯分布的解码器了，于是我们只需要从单位高斯分布中菜样出一个潜在向量，并将其传到解码器中即可。

在VAE中，假定认为输入数据的数据集D(显示变量)的分布完全有一组隐变量z操控，而这组隐变量之间相互独立而且服从高斯分布，那么VAE让encoder去学习输入数据的隐变量模型，也就是去学习这组隐变量的高斯概率分布的参数均值和方差，而隐变量z就可以从这组分布参数的正态分布中采样得到z~N，再通过decoder对z隐变量进行解码来重构输入，本质上是实现了连续的，平滑的潜在空间表示。

对于目标函数，误差项精度与潜在变量在单位高斯分布上的契合程度，包括两部分的内容：1、生成误差，用以衡量网络在重构图像精度的均方误差，2、潜在误差，用以衡量潜在变量在单位高斯分布上契合程度的KL散度，总的目标函数如下：

假设现在有一个样本集中两个概率分布p，q，其中p为真实分布，q为非真实分布，那么，按照真实分布p来衡量识别一个样本所需的编码长度的期望为：

如果采用错误的分布q来表示来自真实分布p的平均编码长度，则应该是：

此时，就将H(p，q)称之为交叉熵。

对于KL散度，又称为相对熵，就是两个概率分布P和Q差别的非对称性度量。典型情况下，P表示数据的真实分布，Q表示数据的理论分布，那么D(P||Q)的计算如下：

KL散度不是对称的，并不满足距离的性质，即D(P||Q) != D(Q||P)。为了解决对称问题，我们引入JS散度。

JS散度度量了两个概率分布的相似度，基于KL散度的变体，解决了KL散度的非对称的问题，一般的，JS散度是对称的，其取值是0到1之间，计算如下：

明白了度量之后，在VAE模型中并没有真正的用z~N来采样得到z变量，因为采样之后，无法进行求导。其做法是先采样一个标准高斯分布(正态分布)，然后通过变换得到z~N分布，这样就能够对参数进行正常的求导计算了：

VAE遵循编码-解码的模式，能直接把生成的图像同原始图像进行对比，不足的是由于它是直接均方误差，其神经网络倾向于生成模糊的图像。

GAN的前身——VAE模型原理的更多相关文章

AIOps探索：基于VAE模型的周期性KPI异常检测方法——VAE异常检测
AIOps探索:基于VAE模型的周期性KPI异常检测方法 from:jinjinlin.com 作者:林锦进前言在智能运维领域中,由于缺少异常样本,有监督方法的使用场景受限.因此,如何利用无监 ...
word2vec模型原理与实现
word2vec是Google在2013年开源的一款将词表征为实数值向量的高效工具. gensim包提供了word2vec的python接口. word2vec采用了CBOW(Continuous B ...
【转】Select模型原理
Select模型原理利用select函数,判断套接字上是否存在数据,或者能否向一个套接字写入数据.目的是防止应用程序在套接字处于锁定模式时,调用recv(或send)从没有数据的套接字上接收数据,被迫 ...
Select模型原理
Select模型原理利用select函数,推断套接字上是否存在数据,或者是否能向一个套接字写入数据.目的是防止应用程序在套接字处于锁定模式时,调用recv(或send)从没有数据的套接字上接收数据, ...
asp.net请求响应模型原理随记回顾
asp.net请求响应模型原理随记回顾: 根据一崇敬的讲师总结:(会存在些错误,大家可以做参考) 1.-当在浏览器输入url后,客户端会将请求根据http协议封装成为http请求报文.并通过主sock ...
Actor模型原理
1.Actor模型在使用Java进行并发编程时需要特别的关注锁和内存原子性等一系列线程问题,而Actor模型内部的状态由它自己维护即它内部数据只能由它自己修改(通过消息传递来进行状态修改),所以使用 ...
[NLP] TextCNN模型原理和实现
1. 模型原理 1.1 论文 Yoon Kim在论文(2014 EMNLP) Convolutional Neural Networks for Sentence Classification提出Te ...
Holt-Winters模型原理分析
Holt-Winters模型原理分析及代码实现(python) from:https://blog.csdn.net/u010665216/article/details/78051192 引言最近 ...
阅读笔记--java内存模型原理
在阅读本篇文章之前,我所理解的和上网了解到的java内存模型原理如下: 不同架构的物理计算机可以有不一样的内存模型,Java 虚拟机也有自己的内存模型.Java 虚拟机规范中试图定义一种 Java 内 ...

随机推荐

前端架构演进及主流UI
@ 目录前端三要素 JavaScript 框架 NodeJs 常用UI框架前后端分离的演进 MVVM模式总结前端演进到现在,各种技术框架已经层出不穷了,作为一名开发少不了要干一些前端的活儿,那 ...
Java - window下环境配置
JDK下载官网:https://www.oracle.com/java/technologies/javase-jdk8-downloads.html 百度网盘: 链接:https://pan.ba ...
Python函数的返回值和作用域
函数的返回值和作用域 1.返回值 def guess(x): if x > 3: return "> 3" else: retu ...
idea ------- 源码调试运行
1.创建一个想学的 ,使用单步调试进行一步步学习调整系统资源单步调试 (F7) ,进入不了源码,调整idea 让我们可以进入底层学习想要在源码里面添加注释,要将引用的源文件指向,我们刚才复制 ...
如何防止CDN防护被绕过
当攻击者发现目标站点存在CDN防护的时候,会尝试通过查找站点的真实IP,从而绕过CDN防护.我们来看一个比较常见的基于公有云的高可用架构,如下:CDN(入口层)->WAF(应用层防护)-> ...
Python 代码编辑器怎么选？PyCharm、VS Code、Jupyter Notebook 都各有特色
Python 代码编辑器怎么选?PyCharm.VS Code.Jupyter Notebook 都各有特色,Jupyter 适合做数据分析这些需要可视化的操作,PyCharm 更适合做完整的 Pyt ...
C# XML相关操作
XML是一种意见单文本格式存储数据的方式,这意味着它可以被任何计算机读取.XML中完整的数据集就是XML文档. 在名称空间System.Xml下面大部分类型都是用来支持DOM处理模型的.其中很多类型配 ...
用Python打造电脑人脸屏幕解锁神器附带接头暗号！
前言最近突然有个奇妙的想法,就是当我对着电脑屏幕的时候,电脑会先识别屏幕上的人脸是否是本人,如果识别是本人的话需要回答电脑说的暗语,答对了才会解锁并且有三次机会.如果都没答对就会发送邮件给我,通知有 ...
[wp]xctf newscenter
手工注入查询所有数据库名称和表名 ' union select 1,table_schema,table_name from information_schema.tables# 发现就两个数据库i ...
隐藏响应中的server和X-Powered-By
来源:https://www.yduba.com/biancheng-7831560074.html 有时候,我们用调试工具查看别人的网站时,经常看到 X-Powered-By:PHP/7.1.8 这 ...

GAN的前身——VAE模型原理

GAN的前身——VAE模型

GAN的前身——VAE模型原理的更多相关文章

随机推荐

热门专题