导读 本文讨论了最新爆款论文(Training RNNs as Fast as CNNs)提出的LSTM变种SRU(Simple Recurrent Unit),以及基于pytorch实现了SRU,并且在四个句子分类的数据集上测试了准确性以及与LSTM.CNN的速度对比. 一 .为什么要提出SRU? 深度学习的许多进展目前很多均是来源于增加的模型能力以及相关的计算,这经常涉及到更大.更深的深层神经网络,然而,虽然深层神经网络带来了明显的提升,但是也耗费了巨大的训练时间,特别是在语音识别以及机器翻…