Python实现LR(逻辑回归)

运行环境

Pyhton3
numpy(科学计算包)
matplotlib(画图所需，不画图可不必)

计算过程

st=>start: 开始

e=>end

op1=>operation: 读入数据

op2=>operation: 格式化数据

cond=>condition: 达到循环次数

op3=>operation: 梯度上升

op4=>operation: 输出结果

st->op1->op2->cond

cond(no)->op3->cond

cond(yes)->op4->e

输入样例

/* Dataset.txt */

训练集:

    vector(第一项是截距项)        label

    ------------------------------------------

    [1, 1, 4]                     1

    [1, 2, 3]                     1

    [1, -2, 3]                    1

    [1, -2, 2]                    0

    [1, 0, 1]                     0

    [1, 1, 2]                     0

测试集:

    vector(第一项是截距项)        label

    ------------------------------------------

    [1, 1, 1]                     ?

    [1, 2, 0]                     ?

    [1, 2, 4]                     ?

    [1, 1, 3]                     ?

代码实现

# -*- coding: utf-8 -*-

__author__ = 'Wsine'

from numpy import *

import matplotlib.pyplot as plt

import operator

import time

LINE_OF_DATA = 6

LINE_OF_TEST = 4

def createTrainDataSet():

	trainDataMat = [[1, 1, 4],

					[1, 2, 3],

					[1, -2, 3],

					[1, -2, 2],

					[1, 0, 1],

					[1, 1, 2]]

	trainShares = [1, 1, 1, 0, 0,  0]

	return trainDataMat, trainShares

def createTestDataSet():

	testDataMat = [[1, 1, 1],

				   [1, 2, 0],

				   [1, 2, 4],

				   [1, 1, 3]]

	return testDataMat

def autoNorm(dataSet):

	minVals = dataSet.min(0)

	maxVals = dataSet.max(0)

	ranges = maxVals - minVals

	normDataSet = zeros(shape(dataSet))

	m = dataSet.shape[0]

	normDataSet = dataSet - tile(minVals, (m, 1))

	normDataSet = normDataSet / tile(ranges, (m, 1))

	return normDataSet[:LINE_OF_DATA], normDataSet[LINE_OF_DATA:]

def sigmoid(inX):

	return 1.0 / (1 + exp(-inX))

def gradAscent(dataMatIn, classLabels, alpha=0.001, maxCycles=1000):

	dataMatrix = mat(dataMatIn)

	labelMat = mat(classLabels).transpose()

	m, n = shape(dataMatrix)

	weights = ones((n, 1))

	for k in range(maxCycles):

		h = sigmoid(dataMatrix * weights)

		error = (labelMat - h)

		weights = weights + alpha * dataMatrix.transpose() * error

	return weights

def plotBestFit(weights):

	dataMat, labelMat = createTrainDataSet()

	dataArr = array(dataMat)

	n = shape(dataArr)[0]

	xcord1 = []; ycord1 = []

	xcord2 = []; ycord2 = []

	for i in range(n):

		if int(labelMat[i]) == 1:

			xcord1.append(dataArr[i, 1])

			ycord1.append(dataArr[i, 2])

		else:

			xcord2.append(dataArr[i, 1])

			ycord2.append(dataArr[i, 2])

	fig = plt.figure()

	ax = fig.add_subplot(111)

	ax.scatter(xcord1, ycord1, s=30, c='red', marker='s')

	ax.scatter(xcord2, ycord2, s=30, c='green')

	x = arange(-3.0, 3.0, 0.1)

	y = (-weights[0] - weights[1] * x) / weights[2]

	ax.plot(x, y)

	plt.xlabel('X1'); plt.ylabel('X2')

	plt.show()

def classifyVector(inX, weights):

	prob = sigmoid(sum(inX * weights))

	if prob > 0.5:

		return 1

	else:

		return 0

def classifyAll(dataSet, weights):

	predict = []

	for vector in dataSet:

		predict.append(classifyVector(vector, weights))

	return predict

def main():

	trainDataSet, trainShares = createTrainDataSet()

	testDataSet = createTestDataSet()

	#trainDataSet, testDataSet = autoNorm(vstack((mat(trainDataSet), mat(testDataSet))))

	regMatrix = gradAscent(trainDataSet, trainShares, 0.01, 600)

	print("regMatrix = \n", regMatrix)

	plotBestFit(regMatrix.getA())

	predictShares = classifyAll(testDataSet, regMatrix)

	print("predictResult: \n", predictShares)

if __name__ == '__main__':

	start = time.clock()

	main()

	end = time.clock()

	print('finish all in %s' % str(end - start))

输出样例

regMatrix =

 [[-2.7205211 ]

 [ 0.19112108]

 [ 1.23590529]]

predictResult:

 [0, 0, 1, 1]

finish all in 18.206848995807043

Python实现LR(逻辑回归)的更多相关文章

Python机器学习算法 — 逻辑回归（Logistic Regression）
逻辑回归--简介逻辑回归(Logistic Regression)就是这样的一个过程:面对一个回归或者分类问题,建立代价函数,然后通过优化方法迭代求解出最优的模型参数,然后测试验证我们这个求解的模型 ...
[深度学习]Python/Theano实现逻辑回归网络的代码分析
2014-07-21 10:28:34 首先PO上主要Python代码(2.7), 这个代码在Deep Learning上可以找到. # allocate symbolic variables for ...
Spark LR逻辑回归中RDD转DF中VectorUDT设置
System.setProperty("hadoop.home.dir", "C:\\hadoop-2.7.2"); val spark = SparkSess ...
LR逻辑回归文章
http://blog.csdn.net/suipingsp/article/details/41822313
恶性肿瘤预测Python程序（逻辑回归）
from sklearn.linear_model import LinearRegression,SGDRegressor,Ridge,LogisticRegression from sklearn ...
每日一个机器学习算法——LR(逻辑回归)
本系列文章用于汇集知识点,查漏补缺,面试找工作之用.数学公式较多,解释较少. 1.假设 2.sigmoid函数: 3.假设的含义: 4.性质: 5.找一个凸损失函数 6.可由最大似然估计推导出单个样 ...
线性模型之逻辑回归(LR)(原理、公式推导、模型对比、常见面试点)
参考资料(要是对于本文的理解不够透彻,必须将以下博客认知阅读,方可全面了解LR): (1).https://zhuanlan.zhihu.com/p/74874291 (2).逻辑回归与交叉熵 (3) ...
Coursera《machine learning》--（6）逻辑回归
六逻辑回归(Logistic Regression:LR) 逻辑回归(Logistic Regression, LR)模型其实仅在线性回归的基础上,套用了一个逻辑函数,但也就是由于这个逻辑函数,使得 ...
用Python开始机器学习（7：逻辑回归分类） --好！！
from : http://blog.csdn.net/lsldd/article/details/41551797 在本系列文章中提到过用Python开始机器学习(3:数据拟合与广义线性回归)中提到 ...

随机推荐

mem中需找特定字符
memstr //find 'substr' from a fixed-length buffer //('full_data' will be treated as binary data buff ...
第四次java实验报告
20145306 实验四 java 开发基础设计过程: 1.创建项目 2.选择activity_main.xml 3.显示自己的学号 4.双击改变字体大小 5.预览
操作系统模仿CMD
实验一.命令解释程序的编写专业:商软(2)班姓名:列志华学号:201406114254 一. 实验目的 (1)掌握命令解释程序的原理: (2)掌握简单的DOS调用方法: (3 ...
leetcode 118
118. Pascal's Triangle Given numRows, generate the first numRows of Pascal's triangle. For example, ...
EasyUI 后台管理系统
基础功能版: 测试地址:http://dev.blueapp.cn/index.php/2014/07/03/101/ 用户名:admin密码:123456 有问题可一起探讨,源码后期将放出一直未测 ...
text-rendering 详解
原文链接:http://www.feeldesignstudio.com/2013/05/text-rendering Text-rendering 属性是一个非标准属性,主要用来告诉渲染引擎(ren ...
PHP计算某个目录大小的方法
用PHP来计算某个目录大小的方法. PHP CURL session COOKIE 可以调用系统命令,还可以这样: <?php function dirsize($dir) { @$dh ...
redis的安装过程基本配置及遇到问题的解决
下载软件包在centos下如果没有wget先安装 wgetyum -y install wgetwget http://download.redis.io/releases/redis-3.0.0. ...
wordpress学习-themes-001
这一篇主要是来记录wordpress theme的内容.关于为什么要自己编写wordpress theme的理由,相信大家都有各自的体会.想让自己的博客变的更加突出?更加个性话?wordpress t ...
mybatis使用笔记
关于动态SQL里的条件查询(if test): 1.lombok插件和mybatis插件在有些变量名下会冲突,比如一个变量为rType的字段,lombok插件认为应该是getRType,但是mybat ...

Python实现LR(逻辑回归)

Python实现LR(逻辑回归)

运行环境

计算过程

输入样例

代码实现

输出样例

Python实现LR(逻辑回归)的更多相关文章

随机推荐

热门专题