目录 1. 概括 2. 相关工作 3. 方法细节 门限模块的结构 训练方法 4. 总结 作者对residual network进行了改进:加入了gating network,基于上一层的激活值,得到一个二进制的决策0或1,从而继续推断或跳过下一个block.作者还提出了对应的训练方法,集成有监督学习和强化学习,从而克服了skipping不可差分的问题. 1. 概括 难点:skipping决策是不可差分的,那么就无法用基于梯度的优化方法进行学习. [2,30,31]提出了软近似,但实验发现它们的精…