目录 动机 单层视角 多层视角 什么是Batch Normalization Batch Normalization的反向传播 Batch Normalization的预测阶段 Batch Normalization的作用 几个问题 卷积层如何使用BatchNorm? 没有scale and shift过程可不可以? BN层放在ReLU前面还是后面? BN层为什么有效? 参考 博客:blog.shinelee.me | 博客园 | CSDN 动机 在博文<为什么要做特征归一化/标准化? 博客园…