梯度下降法 下面的h(x)是要拟合的函数,J(θ)损失函数,theta是参数,要迭代求解的值,theta求解出来了那最终要拟合的函数h(θ)就出来了.其中m是训练集的记录条数,j是参数的个数. 梯度下降法流程: (1)先对θ随机赋值,可以是一个全零的向量. (2)改变θ的值,使J(θ)按梯度下降的方向减少. 以上式为例: (1)对于我们的函数J(θ)求关于θ的偏导: (2)下面是更新的过程,也就是θi会向着梯度最小的方向进行减少.θi表示更新之前的值,-后面的部分表示按梯度方向减少的量,α表