在神经网络训练时,还涉及到一些tricks,如网络权重的初始化方法,优化器种类(权重更新),图片预处理等,继续填坑. 1. 神经网络初始化(Network Initialization ) 1.1 初始化原因 我们构建好网络,开始训练前,不能默认的将所有权重系数都初始化为零,因为所有卷积核的系数都相等时,提取特征就会一样,反向传播时的梯度也会存在对称性,网络会退化会线性模型.另外网络层数较深时,初始化权重过大,会出现梯度爆炸,而过小又会出现梯度消失.一般权重初始化时需要考虑两个问题: (1)权重