deeplearning.ai学习LSTM

一、LSTM架构与公式

这里的a<t>表示的就是原始输出，y<t>表示的就是经过softmax的输出，c<t>相当于状态。u(update)代表是输入门，f代表遗忘门，o(output)代表输出门。

上图就是串联起来的结构，从图中我们可以看出，如果门控设置比较合理的话，c<0>从左到右是可以一直传递的，无论中间经过多少层，这就是LSTM可以处理长依赖的优势。

二、Bidirectional RNN(双向RNN结构)

上图就是andrew ng画的双向RNN的结构示意图，该结构还是以序列标注的问题作为例子解释的。从图示可以看出，一个是从左到右计算a<1>--->a<2>--->a<3>--->a<4>，另一个方向是从右向左计算a<4>--->a<3>--->a<2>--->a<1>，根据最终两个方向计算出来的a<t>来计算最终的输出y<t>。计算公式如下：

上图每一个节点cell可以是普通RNN结构，也可以是GRU或者LSTM。

三、Deep RNN

如图所示的深层RNN共有三层，RNN对于计算资源要求比较高，所以三层已经不少了，其各个节点a和输出值y计算如下：

其中的每个方框节点cell，同样可以是普通RNN，GRU或者LSTM.

deeplearning.ai学习LSTM的更多相关文章

DeepLearning.ai学习笔记汇总
第一章神经网络与深度学习(Neural Network & Deeplearning) DeepLearning.ai学习笔记(一)神经网络和深度学习--Week3浅层神经网络 DeepLe ...
DeepLearning.ai学习笔记（三）结构化机器学习项目--week2机器学习策略(2)
一.进行误差分析很多时候我们发现训练出来的模型有误差后,就会一股脑的想着法子去减少误差.想法固然好,但是有点headlong~ 这节视频中吴大大介绍了一个比较科学的方法,具体的看下面的例子还是以猫 ...
deeplearning.ai学习RNN
一.RNN基本结构普通神经网络不能处理时间序列的信息,只能割裂的单个处理,同时普通神经网络如果用来处理文本信息的话,参数数目将是非常庞大,因为如果采用one-hot表示词的话,维度非常大. RNN可 ...
DeepLearning.ai学习笔记（一）神经网络和深度学习--Week3浅层神经网络
介绍 DeepLearning课程总共五大章节,该系列笔记将按照课程安排进行记录. 另外第一章的前两周的课程在之前的Andrew Ng机器学习课程笔记(博客园)&Andrew Ng机器学习课程 ...
DeepLearning.ai学习笔记（五）序列模型 -- week1 循环序列模型
一.为什么选择序列模型序列模型可以用于很多领域,如语音识别,撰写文章等等.总之很多优点... 二.数学符号为了后面方便说明,先将会用到的数学符号进行介绍. 以下图为例,假如我们需要定位一句话中人名 ...
DeepLearning.ai学习笔记（五）序列模型 -- week2 自然语言处理与词嵌入
一.词汇表征首先回顾一下之前介绍的单词表示方法,即one hot表示法. 如下图示,"Man"这个单词可以用 \(O_{5391}\) 表示,其中O表示One_hot.其他单词同 ...
DeepLearning.ai学习笔记（五）序列模型 -- week2 序列模型和注意力机制
一.基础模型假设要翻译下面这句话: "简将要在9月访问中国" 正确的翻译结果应该是: "Jane is visiting China in September" ...
DeepLearning.ai学习笔记（二）改善深层神经网络：超参数调试、正则化以及优化--Week2优化算法
1. Mini-batch梯度下降法介绍假设我们的数据量非常多,达到了500万以上,那么此时如果按照传统的梯度下降算法,那么训练模型所花费的时间将非常巨大,所以我们对数据做如下处理: 如图所示,我 ...
DeepLearning.ai学习笔记（四）卷积神经网络 -- week1 卷积神经网络基础知识介绍
一.计算机视觉如图示,之前课程中介绍的都是64* 64 3的图像,而一旦图像质量增加,例如变成1000 1000 * 3的时候那么此时的神经网络的计算量会巨大,显然这不现实.所以需要引入其他的方法来 ...

随机推荐

Alpha阶段_团队分数分配
小组成员分数分配薄霖 74 徐越 65 赵庶宏 65 赵铭 41 武鑫 39 卞忠昊 36 叶能端 30
M1事后分析报告--We have power to change the origin state
M1事后分析报告设计与实现我们发的软件解决的问题?是否满足后面小组的要求?是否能够完全拟合前期目标? 答: 前期我们的软件完成量并不是特别让人满意,我们组在完成这些任务量之后,发现有很多地方是在做 ...
《Linux内核分析》第三周学习笔记
<Linux内核分析>第三周学习笔记构造一个简单的Linux系统MenuOS 郭垚原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.stud ...
@Autowire和@Resource注解的区别
1.@Autowire是Spring开发的,而@Resource是jdk开发的 2.@Autowire是按照type来注解的,而@Resource是按照名称来的,如果名称找不到,那么就按照type,, ...
SqlServer测试SQL语句执行效率
方法一: SET STATISTICS io ON SET STATISTICS time ON go ---需要测试的sql语句 go SET STATISTICS profile OFF SET ...
【华为机试】—— 15.求int型正整数在内存中存储时1的个数
题目解法 import java.util.Scanner; public class Main { public static void main(String[] args) { Scanner ...
一本通1635【例 5】Strange Way to Express Integers
1635:[例 5]Strange Way to Express Integers sol:貌似就是曹冲养猪的加强版,初看感觉非常没有思路,经过一番艰辛的***,得到以下的结果随便解释下给以后的自己 ...
bzoj5301[CQOI2018]异或序列
题意已知一个长度为 n 的整数数列 a[1],a[2],-,a[n] ,给定查询参数 l.r ,问在 [l,r] 区间内,有多少连续子序列满足异或和等于 k . 也就是说,对于所有的 x,y (l ...
洛谷 P1344 [USACO4.4]追查坏牛奶Pollutant Control 解题报告
P1344 [USACO4.4]追查坏牛奶Pollutant Control 题目描述你第一天接手三鹿牛奶公司就发生了一件倒霉的事情:公司不小心发送了一批有三聚氰胺的牛奶.很不幸,你发现这件事的时候 ...
敏捷持续集成(Jenkins)
在前面已经完成git和gitlab的相关操作 1.持续集成的概念: 1. 什么是持续集成: 持续集成是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可 ...

deeplearning.ai学习LSTM

deeplearning.ai学习LSTM的更多相关文章

随机推荐

热门专题