背景 在seq2seq中,一般是有一个encoder 一个decoder ,一般是rnn/cnn 但是rnn 计算缓慢,所以提出了纯用注意力机制来实现编码解码. 模型结构 大部分神经序列转导模型都有一个编码器-解码器结构.这里,编码器映射一个用符号表示的输入序列(x1,...,xn) 到一个连续的表示z = (z1,...,zn). 根据z,解码器生成符号的一个输出序列(y1,...,ym) , 一次一个元素. 当生成下一个时,消耗先前生成的符号作为附加输入. Encoder and Decod