在下面的内容中,我们用C来表示需要分的类数. 最后一层的隐藏单元个数为4,为所分的类的数目,输出的值表示属于每个类的概率. Softmax函数的具体步骤如下图: 简单来说有三步: 计算z值(4×1矩阵) 将z作为指数,得到中间变量t(维度同z) 对t归一化,得到a(维度同t,同z). Softmax激活函数的特殊之处在于,输入一个向量,最后输出一个向量. Softmax的示例 下面我们来来考虑一个只有输出层没有隐藏层的神经网络. 在这张图表中,我们所做的是选择图中的数据作为训练集,用数据的C种标