RNN

在DNN中，当前输出层的值只和当前输入值有关系。如果当前输出值不仅依赖当前输入值，也依赖于前面时刻的输入值，那么DNN就不适用了。因此也就有了RNN。

一、RNN结构

这是最简单的RNN。其中X_t是t时刻的输入，S是隐藏层。O_t是t时刻的输出。隐藏层S_t是由前t-1个时刻的隐藏层叠加而成的。把S_t也可以理解为前t时刻x的记忆叠加而成的隐藏层。

二、RNN的前向传播

1、记

其中σ_s为激活函数。W是隐藏层S上的权重，如上式所示，作用跟输入一起来迭代S。

2、

其中σ_t为激活函数

o_t为t时刻的输出也是叠加了了t-1之前时刻输入的输出

U为输入层的权重

V为隐藏层到输出层的权重

三、 RNN的反向传播（BPTT，back-propagation through time）

为了学习，假设σ_s为tanh函数，σ_t为softmax函数。

求参的过程还是和大多数学过的模型求参一样，列出损失函数，例如MSE，交叉熵等，然后用最大似然估计求参数形式，再用SGD随机梯度下降求解。

这里面需要求U、W、V。

1、

2、

3、损失函数，在图中，在unfold里面，由于每一点都有一个o，因此每一点都有一个损失。因此总的损失就是每一点损失之和。

4、记

o^h为模型输出值，没有上标h的o为真实值。

5、对V求导

6、对W求导。

（1）

（2）

（3）由于

（4）为了解下计算过程，简单起见，设i=2

以次类推。

7、对U求导

（1）

（2）

8、有了每个参数的梯度，然后利用SGD可以更新参数了。

RNN的更多相关文章

RNN求解过程推导与实现
RNN求解过程推导与实现 RNN LSTM BPTT matlab code opencv code BPTT,Back Propagation Through Time. 首先来看看怎么处理RNN. ...
在RNN中使用Dropout
dropout在前向神经网络中效果很好,但是不能直接用于RNN,因为RNN中的循环会放大噪声,扰乱它自己的学习.那么如何让它适用于RNN,就是只将它应用于一些特定的RNN连接上. LSTM的长期记 ...
RNN 入门学习资料整理
建议按序阅读 1. RNN的一些简单概念介绍 A guide to recurrent neural networks and backpropagation Deep learning:四十九(RN ...
lecture7-序列模型及递归神经网络RNN
Hinton 第七课 .这里先说下RNN有recurrent neural network 和 recursive neural network两种,是不一样的,前者指的是一种人工神经网络,后者指的是 ...
RNN 入门教程 Part 4 – 实现 RNN-LSTM 和 GRU 模型
转载 - Recurrent Neural Network Tutorial, Part 4 – Implementing a GRU/LSTM RNN with Python and Theano ...
RNN 入门教程 Part 3 – 介绍 BPTT 算法和梯度消失问题
转载 - Recurrent Neural Networks Tutorial, Part 3 – Backpropagation Through Time and Vanishing Gradien ...
RNN 入门教程 Part 2 – 使用 numpy 和 theano 分别实现RNN模型
转载 - Recurrent Neural Networks Tutorial, Part 2 – Implementing a RNN with Python, Numpy and Theano 本 ...
RNN 入门教程 Part 1 – RNN 简介
转载 - Recurrent Neural Networks Tutorial, Part 1 – Introduction to RNNs Recurrent Neural Networks (RN ...
CNN & RNN 及一些常识知识（不断扩充中）
参考: http://blog.csdn.net/iamrichardwhite/article/details/51089199 一.神经网络的发展历史五六十年代,提出感知机八十年代,提出多层感 ...
循环神经网络(RNN, Recurrent Neural Networks)介绍（转载）
循环神经网络(RNN, Recurrent Neural Networks)介绍这篇文章很多内容是参考:http://www.wildml.com/2015/09/recurrent-neur ...

随机推荐

Shiro中的Remember me设置
1. 在Spring的相关配置文件中加入如下Remember me管理器配置:  <bean id="rememberMeMan ...
Spring -- <mvc:annotation-driven />
<mvc:annotation-driven /> 会自动注册:RequestMappingHandlerMapping .RequestMappingHandlerAdapter 与Ex ...
Session&&cookie
1.session存在于服务器而cookie存在于客户端: 2.持续时间均为20分钟: 3.session存放的是一个obgect类型,而cookie是string类型: 4.session赋值:Se ...
A1105. Spiral Matrix
This time your job is to fill a sequence of N positive integers into a spiral matrix in non-increasi ...
跟着 underscore 学节流
更多内容请参考:我的新博客在上一篇文章中,我们了解了为什么要限制事件的频繁触发,以及如何做限制: debounce 防抖 throttle 节流上次已经说过防抖的实现了,今天主要来说一下节流的实现 ...
如何计算Java对象所占内存的大小
[ 简单总结: 随便一个java项目,引入jar包: lucene-core-4.0.0.jar 如果是 maven项目,直接用如下依赖: <dependency> <groupId ...
HOG特征（Histogram of Gradient）学习总结
最近在做的项目有用到HOG+SVM这一方面的知识,参考相关论文和网上一些博文在此对HOG特征进行下总结. 参考资料: HOG的经典论文:Dalal N, Triggs B. Histograms of ...
JS中的toString方法
JS中的所有对象都具有toString方法,它把一个变量隐式转换为字符串 Number类型的对象的toString()方法比较特殊,有默认模式和基模式两种默认模式: 无论我们用什么表示法声明数字变量 ...
exgcd证明和最基础应用
如何求解这个方程:$ax + by = gcd (a, b)$? $∵gcd(a, b) = gcd (b, a \% b)$ $∴$易证 $ gcd(a, b)$ 总是可以化为 \(gc ...
PubMed数据下载
目标站点分析目标:抓取页面中的机构名称,日期,标题,作者, 作者信息, 摘要程序实现 # -*- coding: utf-8 -*- """ @Datetime: 2 ...

RNN

一、RNN结构

二、RNN的前向传播

三、 RNN的反向传播（BPTT，back-propagation through time）

RNN的更多相关文章

随机推荐

热门专题