Batch Normalization,拆开来看,第一个单词意思是批,出现在梯度下降的概念里,第二个单词意思是标准化,出现在数据预处理的概念里. 我们先来看看这两个概念. 数据预处理 方法很多,后面我会在其他博客中专门讲,这里简单回忆下 归一化,x-min/max-min, 标准化,包括标准差标准化,x-mean/std,极差标准化,x-mean/(max-min), 中心化,x-mean, 白化,pac-->归一化 梯度下降 梯度下降中 mini batch sgd 是比 sgd 更好的一种方