注:这是2017年课程的lecture8.一直都在用RNN,但是对它内部的构造不甚了解,所以这次花了一个下午加一个晚上看了CS224n中关于RNN的推导,不敢说融会贯通,算是比以前清楚多了.做个笔记,便于日后查阅. Overview 主要讲了以下几个内容: 传统语言模型 RNN和RNN语言模型 一些问题(梯度消失爆炸问题)和训练技巧 RNN的其他应用 双向RNN和多层RNN 传统语言模型 语言模型 首先介绍语言模型的概念,简言之,语言模型描述了一个单词序列的概率,原文是a language mo…