Word Embedding Word Embedding是一种词的向量表示,比如,对于这样的"A B A C B F G"的一个序列,也许我们最后能得到:A对应的向量为[0.1 0.6 -0.5],B对应的向量为[-0.2 0.9 0.7]. 之所以希望把每个单词变成一个向量,目的还是为了方便计算,比如"求单词A的同义词",就可以通过"求与单词A在cos距离下最相似的向量"来做到. 那么如何进行词嵌入呢?目前主要有三种算法: Embedding
http://www.jianshu.com/p/f3bde26febed/ 这篇是 The Unreasonable Effectiveness of Recurrent Neural Networks(by Andrej Karpathy,Stanford的Li Fei-Fei的博士生.文章介绍了RNN和LSTM,同时也介绍了RNN取得的各种瞩目成果.)以及Understanding LSTM Networks(by Chris Olah)的阅读笔记.网上有很多翻译的版本:<递归神经网络不可
首先介绍一下 encoder-decoder 框架 中文叫做编码-解码器,它一个最抽象的模式可以用下图来展现出来: 这个框架模式可以看做是RNN的一个变种:N vs M,叫做Encoder-Decoder模型,也可以称之为Seq2Seq模型. 原始的N vs N RNN要求序列等长,然而我们遇到的大部分问题序列都是不等长的,如机器翻译中,源语言和目标语言的句子往往并没有相同的长度. 对于文本领域来讲,这个框架可以直观的这么去解释:它可以当做是一个句子(文章)通过处理生成另一个句子(文章)的通用框