转自:https://www.jianshu.com/p/c7e642877b0e

梯度下降法,思想及代码解读。

import numpy as np

# Size of the points dataset.
m = 20 # Points x-coordinate and dummy value (x0, x1).
X0 = np.ones((m, 1))#返回一个m行1列的矩阵
X1 = np.arange(1, m+1).reshape(m, 1)#相当于是转置了
X = np.hstack((X0, X1))#要求行数必须相同 # Points y-coordinate
y = np.array([
3, 4, 5, 5, 2, 4, 7, 8, 11, 8, 12,
11, 13, 13, 16, 17, 18, 17, 19, 21
]).reshape(m, 1) # The Learning Rate alpha.
alpha = 0.01 def error_function(theta, X, y):
'''Error function J definition.'''#定义损失函数
diff = np.dot(X, theta) - y #m行1列的列向量
return (1./2*m) * np.dot(np.transpose(diff), diff) def gradient_function(theta, X, y):
'''Gradient of the function J definition.'''#定义梯度函数
diff = np.dot(X, theta) - y
return (1./m) * np.dot(np.transpose(X), diff) def gradient_descent(X, y, alpha):
'''Perform gradient descent.'''
theta = np.array([1, 1]).reshape(2, 1)
gradient = gradient_function(theta, X, y)
while not np.all(np.absolute(gradient) <= 1e-5):
theta = theta - alpha * gradient
gradient = gradient_function(theta, X, y)
return theta optimal = gradient_descent(X, y, alpha)
print('optimal:', optimal)
print('error function:', error_function(optimal, X, y)[0,0])

梯度的方向即函数上升最快的方向。而加上负号表示朝着相反的方向前进。

初学python语法解读:

1.numpy.ones(shape,dataType,order='C')

其中shape=一个int数或者一个int数序列。dataType一般不选吧,可选的是np.int或者np.float。order:是否将多维数据存储在存储器中的C或FORTRAN连续(行或列)顺序中。(order一般编程不用考虑吧)

栗子1:x=np.ones((3,2))
print(x) 输出:
[[1. 1.]
[1. 1.]
[1. 1.]]#输出全为1的float型的吧。
栗子2:x=np.ones(3)
print(x)
输出:
[1. 1. 1.] #也就是说只有一个int的时候输入就是行向量,输入的int表示有几列。

2.numpy.arange([start,]stop,[step,]dataType=None)

start就是开始,stop是结束。用[]括起来的意思是可选的,不是非必需的参数。step默认是1.关于dataType如果没有指定则和输入的数据类型一致。

#注意这个函数不是arrange,是a range合起来。范围是左闭右开。最后输出的是一个数组,行向量,返回ndarray。

x=np.arange(3)
print(x) #output[0 1 2]
x=np.arange(1,3,0.5)
print(x) #output:[1. 1.5 2. 2.5]

3.np.ndarray.reshape(shape,order='C')

对ndarray返回一个shape型的矩阵。

m=3
X1 = np.arange(1, m+1).reshape(m, 1)#变成一个3行一列的列向量
print(X1) 输出:
[[1]
[2]
[3]]

4.np.hstack(tup)

就是将两个相同形状的矩阵在列上水平方向上合并起来。

a=np.array([[1,2],[3,4]])
b=np.array([[5,6],[7,8]])
c=np.hstack((a,b))
print(c)
#a,b是两行两列的矩阵,在水平方向上合并,在行上合并,即水平方向上。
输出:
[[1 2 5 6]
[3 4 7 8]]

5.np.dot(a,b,out=None)

对于二维的来说就是矩阵a,b的乘积,对于一维来说就是向量的内积。

a = [[1, 0], [0, 1]]
b=[[4, 1], [2, 2]]
print(np.dot(a,b)) 输出:
[[4 1]
[2 2]]

6.np.transpose(a,axis=None)

顾名思义就是转置矩阵。

a = np.arange(4).reshape((2,2))
print(np.transpose(a)) 输出:
[[0 2]
[1 3]]

梯度下降法实现-python[转载]的更多相关文章

  1. 梯度下降法的python代码实现(多元线性回归)

    梯度下降法的python代码实现(多元线性回归最小化损失函数) 1.梯度下降法主要用来最小化损失函数,是一种比较常用的最优化方法,其具体包含了以下两种不同的方式:批量梯度下降法(沿着梯度变化最快的方向 ...

  2. (转)梯度下降法及其Python实现

    梯度下降法(gradient descent),又名最速下降法(steepest descent)是求解无约束最优化问题最常用的方法,它是一种迭代方法,每一步主要的操作是求解目标函数的梯度向量,将当前 ...

  3. 固定学习率梯度下降法的Python实现方案

    应用场景 优化算法经常被使用在各种组合优化问题中.我们可以假定待优化的函数对象\(f(x)\)是一个黑盒,我们可以给这个黑盒输入一些参数\(x_0, x_1, ...\),然后这个黑盒会给我们返回其计 ...

  4. paper 166:梯度下降法及其Python实现

    参考来源:https://blog.csdn.net/yhao2014/article/details/51554910 梯度下降法(gradient descent),又名最速下降法(steepes ...

  5. 简单线性回归(梯度下降法) python实现

    grad_desc .caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { bord ...

  6. Gradient Descent 梯度下降法-R实现

    梯度下降法: [转载时请注明来源]:http://www.cnblogs.com/runner-ljt/ Ljt 作为一个初学者,水平有限,欢迎交流指正. 应用:求线性回归方程的系数 目标:最小化损失 ...

  7. 梯度下降法VS随机梯度下降法 (Python的实现)

    # -*- coding: cp936 -*- import numpy as np from scipy import stats import matplotlib.pyplot as plt # ...

  8. 梯度下降法原理与python实现

    梯度下降法(Gradient descent)是一个一阶最优化算法,通常也称为最速下降法. 要使用梯度下降法找到一个函数的局部极小值,必须向函数上当前点对应梯度(或者是近似梯度)的反方向的规定步长距离 ...

  9. 最小二乘法 及 梯度下降法 运行结果对比(Python版)

    上周在实验室里师姐说了这么一个问题,对于线性回归问题,最小二乘法和梯度下降方法所求得的权重值是一致的,对此我颇有不同观点.如果说这两个解决问题的方法的等价性的确可以根据数学公式来证明,但是很明显的这个 ...

随机推荐

  1. 如何验证 Email 地址:SMTP 协议入门教程

    http://www.ruanyifeng.com/blog/2017/06/smtp-protocol.html 作者: 阮一峰 日期: 2017年6月25日   Email 是最常用的用户识别手段 ...

  2. C语言位操作--判断两整数是否异号

    判断两整数是否异号: int x, y; //输入比较的两数 bool f = ((x ^ y) < 0); // 返回真,当且仅当x与y异号 说明:当x.y异号,x与y的最高位分别为0和1,取 ...

  3. java.lang.instrument 中的premain 实现类的个性化加载(附源代码)

    背景 想调用ASM API (用于字节码处理的开源API)对字节码进行处理,目标是实现对java程序运行时各种对象的动态跟踪,并进一步分析各个对象之间的关系(研究前提是目前的UML锁阐释的whole- ...

  4. 使用COSBench工具对ceph s3接口进行压力测试--续

    之前写的使用COSBench工具对ceph s3接口进行压力测试是入门,在实际使用是,配置内容各不一样,下面列出 压力脚本是xml格式的,套用UserGuide文档说明,如下 有很多模板的例子,在co ...

  5. Django---简单接受表单信息

    普通接受信息: 接受单选的值:例如:input select 等提交过来的信息 u = request.POST.get('username',None) 接受多选: h = request.POST ...

  6. Spark2 broadcast广播变量

    A broadcast variable. Broadcast variables allow the programmer to keep a read-only variable cached o ...

  7. 7.24python协程(2)和IO模型

    2018-7-24 08:50:29 异步IO模型 epoll  机制  linux 给每个监听对象绑定回调函数,当要读的对象来了时候,回调函数直接被执行,然后通知用户,效率非常高! python无法 ...

  8. HTTP协议的前世今生——各版本HTTP协议对比

    HTTP协议是如今互联网与服务端技术的基石,HTTP协议的演进也从侧面反应了互联网技术的快速发展.这两天在准备一次关于HTTP1.1协议特性的技术分享过程中,顺便了解了下各版本HTTP协议的特点,在这 ...

  9. HDU 3038 - How Many Answers Are Wrong - [经典带权并查集]

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=3038 Time Limit: 2000/1000 MS (Java/Others) Memory Li ...

  10. hdu-4283 You Are the One 区间dp,

    题意:n个人排队上台,每个人有一屌丝值D,他的不满意值=D*(k-1)(k为他前面的总人数). 求整个队列不满意值之和的最小值.你只有一个操作,就是把队首的人塞进小黑屋,也就是压入栈中,后面的人就被提 ...