梯度下降算法以及其Python实现

一、梯度下降算法理论知识

我们给出一组房子面积，卧室数目以及对应房价数据，如何从数据中找到房价y与面积x1和卧室数目x2的关系？

为了实现监督学习，我们选择采用自变量x1、x2的线性函数来评估因变量y值，得到：

这里，sita1、sita2代表自变量x1、x2的权重（weights），sita0代表偏移量。为了方便，我们将评估值写作h(x)，令x0=1，则h(x)可以写作：

其中n为输入样本数的数量。为了得到weights的值，我们需要令我们目前的样本数据评估出的h(x)尽可能的接近真实y值。我们定义误差函数（cost function）来表示h(x)和y值相接近的程度：

这里的系数1/2是为了后面求解偏导数时可以与系数相互抵消。我们的目的是要误差函数尽可能的小，即求解weights使误差函数尽可能小。首先，我们随机初始化weigths，然后不断反复的更新weights使得误差函数减小，直到满足要求时停止。这里更新算法我们选择梯度下降算法，利用初始化的weights并且反复更新weights：

这里a代表学习率，表示每次向着J最陡峭的方向迈步的大小。为了更新weights，我们需要求出函数J的偏导数。首先计算只有一个数据样本（x,y）时，如何计算J的偏导数：

对于只含有一组数据的训练样本，我们可以得到更新weights的规则为：

扩展到多组数据样本，更新公式为：

称为批处理梯度下降算法，这种更新算法所需要的运算成本很高，尤其是数据量较大时。考虑下面的更新算法：

该算法又叫做随机梯度下降法，这种算法不停的更新weights，每次使用一个样本数据进行更新。当数据量较大时，一般使用后者算法进行更新。

二、梯度下降Python实现

自己创建了一组数据，存为csv格式，如下图所示：

待训练数据A、B为自变量，C为因变量。
在写程序之前，要先导入我们需要的模块。

1 2	import numpy as np from numpy import genfromtxt

首先将数据读入Python中，程序如下所示：

1 2	dataPath = r"E:\learning\house.csv" dataSet = genfromtxt(dataPath, delimiter=',')

接下来将读取的数据分别得到自变量矩阵和因变量矩阵：

def getData(dataSet):

m, n = np.shape(dataSet)

trainData = np.ones((m, n))

trainData[:,:-1] = dataSet[:,:-1]

trainLabel = dataSet[:,-1]

return trainData, trainLabel

这里需要注意的是，在原有自变量的基础上，需要主观添加一个均为1的偏移量，即公式中的x0。原始数据的前n-1列再加上添加的偏移量组成自变量trainData，最后一列为因变量trainLabel。
下面开始实现批处理梯度下降算法：

def batchGradientDescent(x, y, theta, alpha, m, maxIterations):

xTrains = x.transpose()

for i in range(0, maxIterations):

hypothesis = np.dot(x, theta)

loss = hypothesis - y

gradient = np.dot(xTrains, loss) / m

theta = theta - alpha * gradient

return theta

x为自变量训练集，y为自变量对应的因变量训练集；theta为待求解的权重值，需要事先进行初始化；alpha是学习率；m为样本总数；maxIterations为最大迭代次数；
求解权重过程，初始化batchGradientDescent函数需要的各个参数：

trainData, trainLabel = getData(dataSet)

m, n = np.shape(trainData)

theta = np.ones(n)

alpha = 0.05

maxIteration = 1000

alpha和maxIterations可以更改，之后带入到batchGradientDescent中可以求出最终权重值。

1	theta = batchGradientDescent(trainData, trainLabel, theta, alpha, m, maxIteration)

之后我们给出一组数据，需要进行预测，预测函数：

def predict(x, theta):

m, n = np.shape(x)

xTest = np.ones((m, n+1))

xTest[:, :-1] = x

yPre = np.dot(xTest, theta)

return yPre

x为待预测值的自变量，thta为已经求解出的权重值，yPre为预测结果
我们给出测试集

对该组数据进行预测，程序如下：

1 2	x = np.array([[3.1, 5.5], [3.3, 5.9], [3.5, 6.3], [3.7, 6.7], [3.9, 7.1]]) print predict(x, theta)

输出结果如下：

1	[9.49608552 10.19523475 10.89438398 11.59353321 12.29268244]

我们可以更改学习率和迭代次数进行预测结果的对比：
更改学习率由0.05变为0.1时，结果为：

1	[ 9.49997917 10.19997464 10.89997012 11.59996559 12.29996106]

发现预测结果要由于学习率为0.05时，这说明学习率0.05选择的偏小，即每一次迈步偏小。
固定学习率为0.05，更改迭代次数为5000时，结果为：厦门叉车租赁

1	[ 9.5 10.2 10.9 11.6 12.3]

这正是我们想要的预测结果，这说明有限循环次数内，循环次数越多，越接近真实值。但是也不能无限循环下去，需要寻找一个度。
一般达到以下的任意一种情况即可以停止循环：
1.权重的更新低于某个阈值；
2.预测的错误率低于某个阈值；
3.达到预设的最大循环次数；
其中达到任意一种，就停止算法的迭代循环，得出最终结果。
完整的程序如下：

#coding=utf-8

import numpy as np

import random

from numpy import genfromtxt

def getData(dataSet):

m, n = np.shape(dataSet)

trainData = np.ones((m, n))

trainData[:,:-1] = dataSet[:,:-1]

trainLabel = dataSet[:,-1]

return trainData, trainLabel

def batchGradientDescent(x, y, theta, alpha, m, maxIterations):

xTrains = x.transpose()

for i in range(0, maxIterations):

hypothesis = np.dot(x, theta)

loss = hypothesis - y

# print loss

gradient = np.dot(xTrains, loss) / m

theta = theta - alpha * gradient

return theta

def predict(x, theta):

m, n = np.shape(x)

xTest = np.ones((m, n+1))

xTest[:, :-1] = x

yP = np.dot(xTest, theta)

return yP

dataPath = r"E:\learning\house.csv"

dataSet = genfromtxt(dataPath, delimiter=',')

trainData, trainLabel = getData(dataSet)

m, n = np.shape(trainData)

theta = np.ones(n)

alpha = 0.1

maxIteration = 5000

theta = batchGradientDescent(trainData, trainLabel, theta, alpha, m, maxIteration)

x = np.array([[3.1, 5.5], [3.3, 5.9], [3.5, 6.3], [3.7, 6.7], [3.9, 7.1]])

print predict(x, theta)

我是一个机器学习的小白，刚刚开始接触，从最基本的也是很重要的梯度下降开始学习。这篇文章是我对梯度下降的理解，还有很多不完善的地方，我只给出了批量梯度下降算法的python实现，随机梯度下降还需要我进一步编写，而且关于循环停止，本文只是最简单的循环次数停止，等等，还有很多问题，以后会继续更近并改进该文章。写下来就是为了随时随地翻出来看看，巩固知识，并不断改进。

梯度下降算法以及其Python实现的更多相关文章

【转】梯度下降算法以及其Python实现
一.梯度下降算法理论知识我们给出一组房子面积,卧室数目以及对应房价数据,如何从数据中找到房价y与面积x1和卧室数目x2的关系? 为了实现监督学习,我们选择采用自变量x1.x2的线性函数来评估因变 ...
梯度下降法原理与python实现
梯度下降法(Gradient descent)是一个一阶最优化算法,通常也称为最速下降法. 要使用梯度下降法找到一个函数的局部极小值,必须向函数上当前点对应梯度(或者是近似梯度)的反方向的规定步长距离 ...
梯度下降算法的一点认识（Ng第一课）
昨天开始看Ng教授的机器学习课,发现果然是不错的课程,一口气看到第二课. 第一课没有什么新知识,就是机器学习的概况吧. 第二课出现了一些听不太懂的概念.其实这堂课主要就讲了一个算法,梯度下降算法. ...
ng机器学习视频笔记（二） ——梯度下降算法解释以及求解θ
ng机器学习视频笔记(二) --梯度下降算法解释以及求解θ (转载请附上本文链接--linhxx) 一.解释梯度算法梯度算法公式以及简化的代价函数图,如上图所示. 1)偏导数由上图可知,在a点 ...
监督学习：随机梯度下降算法（sgd）和批梯度下降算法（bgd）
线性回归首先要明白什么是回归.回归的目的是通过几个已知数据来预测另一个数值型数据的目标值. 假设特征和结果满足线性关系,即满足一个计算公式h(x),这个公式的自变量就是已知的数据x,函数值h(x)就 ...
[机器学习Lesson3] 梯度下降算法
1. Gradient Descent(梯度下降) 梯度下降算法是很常用的算法,可以将代价函数J最小化.它不仅被用在线性回归上,也被广泛应用于机器学习领域中的众多领域. 1.1 线性回归问题应用我们 ...
Spark MLib：梯度下降算法实现
声明:本文参考< 大数据:Spark mlib(三) GradientDescent梯度下降算法之Spark实现> 1. 什么是梯度下降? 梯度下降法(英语:Gradient descen ...
AI-2.梯度下降算法
上节定义了神经网络中几个重要的常见的函数,最后提到的损失函数的目的就是求得一组合适的w.b 先看下损失函数的曲线图,如下即目的就是求得最低点对应的一组w.b,而本节要讲的梯度下降算法就是会一步一步地 ...
Logistic回归Cost函数和J(θ)的推导（二）----梯度下降算法求解最小值
前言在上一篇随笔里,我们讲了Logistic回归cost函数的推导过程.接下来的算法求解使用如下的cost函数形式: 简单回顾一下几个变量的含义: 表1 cost函数解释 x(i) 每个样本数据点在 ...

随机推荐

Extjs6 怎么重写框架的类
创建一个覆写(override)类的推荐方法如下: Ext.define('MyApp.overrides.panel.Panel', { override: 'Ext.panel.Panel', c ...
iOS背景音乐不自动播放
iOS 内置浏览器safari不允许自动播放音乐.我们需要通过WeixinJSBridgeReady()函数实现自动触发 document.addEventListener("WeixinJ ...
macOS，安装+配置+激活：MySQL8.0 + Navicat Premium12
作者的电脑是10.13.3,些许配置偏差请自行略过本文是学习探讨途径,请勿滥用,后果自负 MySQL8.0 篇章官网http://www.mysql.com/downloads/ 下载即可,无需激 ...
jQuery笔记: 基本概念与jQuery核心
目录初识jQuery 为什么要使用jQuery? 如何使用jQuery? jQuery与js加载模式不同 jQuery入口函数的四种写法 jQuery的访问符冲突问题 jQuery核心函数和jQue ...
VUE 采坑之旅-- Mint-ui 按需引入报出Module build failed: Error: Couldn't find preset "es2015" relative to directory "C:\\phpStudy\\PHPTutorial\\WWW\\text\\vuep\\vue-demo"
首先按照mint-ui的文档中按需引入的要求,先执行 npm install babel-plugin-component -D 然后,将.babelrc文件替换了,但是后来我又将其改了(采坑过程我也 ...
购物车业务逻辑（vuex）
list(列表页): 1:发送ajax请求,获取相应的数据 2:给每一个上平添加一个点击事件 3:每一个商品都要有一个ID 4:当点击商品时,将商品id值传递给详情页 details(详情页): 1: ...
BurpSuite—-Scanner模块(漏洞扫描)
一.简介 Burp Scanner 是一个进行自动发现 web 应用程序的安全漏洞的工具.它是为渗透测试人员设计的,并且它和你现有的手动执行进行的 web 应用程序半自动渗透测试的技术方法很相似. 使 ...
我的职业规划(android)
通过一段时间的想法,自己大概圈定了自己的未来三年的职业规划,关于android的,希望大家多多批评,多多指教.或者大家也能讨论下自己对于未来的期许或者路线,虽然每个人都有自己自身的情况,但是总会有一些 ...
解决$ go get google.golang.org/grpc上的包被墙的问题
今天get grpc包的时候 $ go get google.golang.org/grpc 发现拉不下来被墙了,在github.com上搜索grpc,clone到工程目录中,运行命令 go inst ...
electron安装与使用
系统 WIN10 X64 1. python-2.7.15.amd64.msi 2. node-v10.4.1-x64.msi 3. VS2015 community(社区版) 4. npm conf ...

梯度下降算法以及其Python实现

梯度下降算法以及其Python实现的更多相关文章

随机推荐

热门专题