0.背景 对于如机器翻译.语言模型.观点挖掘.问答系统等都依赖于RNN模型,而序列的前后依赖导致RNN并行化较为困难,所以其计算速度远没有CNN那么快.即使不管训练的耗时程度,部署时候只要模型稍微大点,实时性也会受到影响. Tao Lei等人基于对LSTM.GRU等模型的研究,提出了SRU模型.在保证速度的前提下,准确度也是没有多少损失. 1.SRU Tao Lei等人通过将每一时间步的主要计算部分,优化为不要去依赖之前时间步的完整计算,从而能够容易的并行化.其结果示意图如图1.1. 图1.1…