Recurrent Neural Network(1):Architecture

Recurrent Neural Network是在单个神经元上，除了输入与输出外，添加了一条Recurrent回路。也就是说，节点当前的状态将会影响其未来的状态。下式可以表征此关系：

s_t= f(s_t-1, x_t,θ)

如下图左侧，将前一时刻神经元的输出状态s，作为下一时刻的一个输入值，加权并入输入U中。这一操作使得，某一时刻神经元的输出状态s，依赖于之前各个时刻的状态s_t-1,s_t-2,...,s_t-n.从而，我们可以说该Recurrent path为神经网络引入了一个新的维度: time dimension.

在上图右侧，我们看到将该neuron在time dimension上展开后的形式，x_t是时间序列各个时间点的输入，s_t是各个时间点上产生的输出状态，而o_t则是各个时间点上该神经元的输出。而在该结构中，参数共有3个：U,W,V，分别是input weight, state weight, and output weight。和CNN一样，RNN同样有parameter sharing的思想，即在时间维度上，共享这三个parameters.

输出状态s_t的计算公式为：

其中f是activation function，可以使sigmoid, tanh, relu等等。而在输出端，如果我们使用Softmax去预测各个输出值的概率，则：

RNN有很多种变体，所有包含循环回路的神经网络都可以归为RNN。概括地说，某一时刻的状态s_t，是之前所有时刻输入x_t,...,x₁的一种有损压缩(Lossy Summary)。

下面是三种不同类型的RNN patterns:

Pattern 1: Hidden unit存在recurrent connections,每一个时间t上都有输出,每个时刻都有输出o,期望值y和Loss function

Pattern 2: Hidden Unit存在recurrent connections,读取完整个序列后，最后产生一个输出o,根据期望值y计算Loss function

Pattern 3: Output Unit对Hidden Unit有Recurrent Connection，每个时刻都有输出o,期望值y和Loss function

Recurrent Neural Network(1):Architecture的更多相关文章

Recurrent Neural Network系列4--利用Python，Theano实现GRU或LSTM
yi作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明.谢谢! 本文翻译自 RECURRENT NEURAL NETWORK ...
Recurrent Neural Network系列1--RNN（循环神经网络）概述
作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明.谢谢! 本文翻译自 RECURRENT NEURAL NETWORKS T ...
Recurrent Neural Network(循环神经网络)
Reference: Alex Graves的[Supervised Sequence Labelling with RecurrentNeural Networks] Alex是RNN最著名变种 ...
Recurrent Neural Network系列2--利用Python，Theano实现RNN
作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明.谢谢! 本文翻译自 RECURRENT NEURAL NETWORKS T ...
Recurrent Neural Network系列3--理解RNN的BPTT算法和梯度消失
作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明.谢谢! 这是RNN教程的第三部分. 在前面的教程中,我们从头实现了一个循环 ...
循环神经网络（Recurrent Neural Network，RNN）
为什么使用序列模型(sequence model)?标准的全连接神经网络(fully connected neural network)处理序列会有两个问题:1)全连接神经网络输入层和输出层长度固定, ...
Recurrent Neural Network[Content]
下面的RNN,LSTM,GRU模型图来自这里简单的综述 1. RNN 图1.1 标准RNN模型的结构 2. BiRNN 3. LSTM 图3.1 LSTM模型的结构 4. Clockwork RNN ...
Recurrent Neural Network[survey]
0.引言我们发现传统的(如前向网络等)非循环的NN都是假设样本之间无依赖关系(至少时间和顺序上是无依赖关系),而许多学习任务却都涉及到处理序列数据,如image captioning,speech ...
【NLP】Recurrent Neural Network and Language Models
0. Overview What is language models? A time series prediction problem. It assigns a probility to a s ...

随机推荐

linux内核的gpiolib详解
#include <linux/init.h> // __init __exit #include <linux/module.h> // module_init module ...
Oracle 常用统计视图汇总
Oracle统计信息对数据库性能优化和故障排除都相当重要,目前接触到的与统计信息相关的视图大体有 4 个: 1.v$sysstat 视图该视图用于记录系统级的统计信息,共 5 ...
Vue学习之旅：todomvc的学习练习
一.前奏 1.todomvc官网地址:http://todomvc.com/ 查阅文档和下载插件都可以到这个官网上找. 2.上GitHub上搜索下载有人做的现成的本地模板:进入GitHub搜索todo ...
Webpack和Gulp对比
Webpack和Gulp对比作者彬_仔关注 2016.10.19 22:42* 字数 8012 阅读 2471评论 18喜欢 68 在现在的前端开发中,前后端分离.模块化开发.版本控制.文件合并 ...
C++ 数组动态分配
数组的动态内存分配 #include <iostream> //一维数组 void oneDimensionalArray() { //定义一个长度为10的数组 int* array = ...
JavaScript基础2——下拉列表左右选择
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...
netcore项目使用swagger开发
首先我创建一个netcore项目,我使用的工具是vs2019 这里需要注意的是,看情况选择是否开启身份验证,一般是没有需求的,这里因为我是测试使用所以需要取消勾兑为https配置,并且我没有启用doc ...
BZOJ 1233 干草堆 (单调队列优化DP)
$ BZOJ~1233~~ $ 干草堆: (题目特殊性质) $ solution: $ 很妙的一道题目,开始看了一眼觉得是个傻逼贪心,从后往前当前层能多短就多短,尽量节省花费.但是这是DP专题,怎么会 ...
jinfo 干涉java runtime的jvm参数
https://blog.csdn.net/bolg_hero/article/details/78156311 jinfo使用介绍可以用来查看正在运行的Java应用程序的扩展参数,甚至支持在运行时, ...
载]mysqlhotcopy 热备工具体验与总结
载]mysqlhotcopy 热备工具体验与总结今天有空尝试了一下MYSQLHOTCOPY这个快速热备MYISAM引擎的工具.(本文是针对单个服务器的情况,以后将会加入多服务器相关操作)他和MYSQ ...

Recurrent Neural Network(1):Architecture

Recurrent Neural Network(1):Architecture的更多相关文章

随机推荐

热门专题