不用相当的独立功夫,不论在哪个严重的问题上都不能找出真理:谁怕用功夫,谁就无法找到真理. —— 列宁 本文主要介绍损失函数.优化器.反向传播.链式求导法则.激活函数.批归一化. 1 经典损失函数 1.1交叉熵损失函数——分类 (1)熵(Entropy) 变量的不确定性越大,熵也就越大,把它搞清楚所需要的信息量也就越大.log以2为底! H(x) = E[I(xi)] = E[ log(2,1/p(xi)) ] = -∑p(xi)log(2,p(xi)) (i=1,2,..n) (2)交叉熵(Cr…