假设一个数据集有n个样本,每个样本有m个特征,样本标签y为{0, 1}. 数据集可表示为: 其中,x(ij)为第i个样本的第j个特征值,y(i)为第i个样本的标签. X矩阵左侧的1相当于回归方程的常数项. 每个特征有一个权重(或系数),权重矩阵为: 开始可以将权重均初始化为1. 将特征及权重分别相乘得到Xw (即特征的线性组合,为n维列向量). 经过Sigmoid函数处理得到预测值: y为预测值(取值范围0-1),为n维列向量. 对于一个样本i,y(i)取值为1和0的概率分别是: 其中x(i)为…