除了前面介绍的权重衰减以外,深度学习模型常常使用丢弃法(dropout)来应对过拟合问题. 方法与原理 为了确保测试模型的确定性,丢弃法的使用只发生在训练模型时,并非测试模型时.当神经网络中的某一层使用丢弃法时,该层的神经元将有一定概率被丢弃掉. 设丢弃概率为 \(p\).具体来说,该层任一神经元在应用激活函数后,有 \(p\) 的概率自乘 0,有 \(1−p\) 的概率自除以 \(1−p\) 做拉伸.丢弃概率是丢弃法的超参数. 多层感知机中,隐层节点的输出: \[h_i = \phi(x_1…