用python实现逻辑回归

机器学习课程的一个实验，整理出来共享。

原理很简单，优化方法是用的梯度下降。后面有测试结果。

# coding=utf-8

from math import exp

import matplotlib.pyplot as plt

import numpy as np

from sklearn.datasets.samples_generator import make_blobs

def sigmoid(num):

    '''

    :param num: 待计算的x

    :return: sigmoid之后的数值

    '''

    if type(num) == int or type(num) == float:

        return 1.0 / (1 + exp(-1 * num))

    else:

        raise ValueError, 'only int or float data can compute sigmoid'

class logistic():

    def __init__(self, x, y):

        if type(x) == type(y) == list:

            self.x = np.array(x)

            self.y = np.array(y)

        elif type(x) == type(y) == np.ndarray:

            self.x = x

            self.y = y

        else:

            raise ValueError, 'input data error'

    def sigmoid(self, x):

        '''

        :param x: 输入向量

        :return: 对输入向量整体进行simgoid计算后的向量结果

        '''

        s = np.frompyfunc(lambda x: sigmoid(x), 1, 1)

        return s(x)

    def train_with_punish(self, alpha, errors, punish=0.0001):

        '''

        :param alpha: alpha为学习速率

        :param errors: 误差小于多少时停止迭代的阈值

        :param punish: 惩罚系数

        :param times: 最大迭代次数

        :return:

        '''

        self.punish = punish

        dimension = self.x.shape[1]

        self.theta = np.random.random(dimension)

        compute_error = 100000000

        times = 0

        while compute_error > errors:

            res = np.dot(self.x, self.theta)

            delta = self.sigmoid(res) - self.y

            self.theta = self.theta - alpha * np.dot(self.x.T, delta) - punish * self.theta  # 带惩罚的梯度下降方法

            compute_error = np.sum(delta)

            times += 1

    def predict(self, x):

        '''

        :param x: 给入新的未标注的向量

        :return: 按照计算出的参数返回判定的类别

        '''

        x = np.array(x)

        if self.sigmoid(np.dot(x, self.theta)) > 0.5:

            return 1

        else:

            return 0

def test1():

    '''

    用来进行测试和画图，展现效果

    :return:

    '''

    x, y = make_blobs(n_samples=200, centers=2, n_features=2, random_state=0, center_box=(10, 20))

    x1 = []

    y1 = []

    x2 = []

    y2 = []

    for i in range(len(y)):

        if y[i] == 0:

            x1.append(x[i][0])

            y1.append(x[i][1])

        elif y[i] == 1:

            x2.append(x[i][0])

            y2.append(x[i][1])

    # 以上均为处理数据，生成出两类数据

    p = logistic(x, y)

    p.train_with_punish(alpha=0.00001, errors=0.005, punish=0.01)  # 步长是0.00001，最大允许误差是0.005，惩罚系数是0.01

    x_test = np.arange(10, 20, 0.01)

    y_test = (-1 * p.theta[0] / p.theta[1]) * x_test

    plt.plot(x_test, y_test, c='g', label='logistic_line')

    plt.scatter(x1, y1, c='r', label='positive')

    plt.scatter(x2, y2, c='b', label='negative')

    plt.legend(loc=2)

    plt.title('punish value = ' + p.punish.__str__())

    plt.show()

if __name__ == '__main__':

    test1()

运行结果如下图

博客首页

用python实现逻辑回归的更多相关文章

机器学习_线性回归和逻辑回归_案例实战：Python实现逻辑回归与梯度下降策略_项目实战：使用逻辑回归判断信用卡欺诈检测
线性回归: 注:为偏置项,这一项的x的值假设为[1,1,1,1,1....] 注:为使似然函数越大,则需要最小二乘法函数越小越好线性回归中为什么选用平方和作为误差函数?假设模型结果与测量值误差满足 ...
机器学习之使用Python完成逻辑回归
一.任务基础我们将建立一个逻辑回归模型来预测一个学生是否被大学录取.假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人的录取机会.你有以前的申请人的历史数据,你可以用它作为逻辑回归的 ...
吴裕雄 python 机器学习——逻辑回归
import numpy as np import matplotlib.pyplot as plt from matplotlib import cm from mpl_toolkits.mplot ...
Python之逻辑回归模型来预测
建立一个逻辑回归模型来预测一个学生是否被录取. import numpy as np import pandas as pd import matplotlib.pyplot as plt impor ...
python机器学习-逻辑回归
1.逻辑函数假设数据集有n个独立的特征,x1到xn为样本的n个特征.常规的回归算法的目标是拟合出一个多项式函数,使得预测值与真实值的误差最小: 而我们希望这样的f(x)能够具有很好的逻辑判断性质,最 ...
python机器学习——逻辑回归
我们知道感知器算法对于不能完全线性分割的数据是无能为力的,在这一篇将会介绍另一种非常有效的二分类模型--逻辑回归.在分类任务中,它被广泛使用逻辑回归是一个分类模型,在实现之前我们先介绍几个概念: 几 ...
python实现逻辑回归
首先得明确逻辑回归与线性回归不同,它是一种分类模型.而且是一种二分类模型. 首先我们需要知道sigmoid函数,其公式表达如下: 其函数曲线如下: sigmoid函数有什么性质呢? 1.关于(0,0. ...
Python使用逻辑回归估算OR值
第一种是统计学方法,需要用到 statsmodels包 statsmodels是统计和计量经济学的package,包含了用于参数评估和统计测试的实用工具第二种是机器学习,需要使用sklearn中的L ...
Python之逻辑回归
代码: import numpy as np from sklearn import datasets from sklearn.linear_model import LogisticRegress ...

随机推荐

0.Win8.1，Win10，Windows Server 2012 安装 Net Framework 3.5
后期会在博客首发更新:http://dnt.dkill.net 网站部署之~Windows Server | 本地部署:http://www.cnblogs.com/dunitian/p/482280 ...
从备考PMP到与项目经理同呼吸
前言 PMP是什么梗? 项目管理专业人士资格认证.它是由美国项目管理协会(Project Management Institute(PMI)发起的,严格评估项目管理人员知识技能是否具有高品质的资格认证 ...
一篇文章看懂TPCx-BB（大数据基准测试工具）源码
TPCx-BB是大数据基准测试工具,它通过模拟零售商的30个应用场景,执行30个查询来衡量基于Hadoop的大数据系统的包括硬件和软件的性能.其中一些场景还用到了机器学习算法(聚类.线性回归等).为了 ...
jq选择器基础
Jquery $代表选择器使用jq必须要导入jq文件 <script src="http://libs.baidu.com/jquery/2.0.0/jquery.min.js&qu ...
jdb调试scala代码的简单介绍
在linux调试C/C++的代码需要通过gdb,调试java代码呢?那就需要用到jdb工具了.关于jdb的用法在网上大家都可以找到相应的文章,但是对scala进行调试的就比较少了.其实调试的大致流程都 ...
ASP.NET SignaiR 实现消息的即时推送，并使用Push.js实现通知
一.使用背景 1. SignalR是什么? ASP.NET SignalR 是为 ASP.NET 开发人员提供的一个库,可以简化开发人员将实时 Web 功能添加到应用程序的过程.实时 Web 功能是指 ...
form表单验证-Javascript
Form表单验证: js基础考试内容,form表单验证,正则表达式,blur事件,自动获取数组,以及css布局样式,动态清除等.完整代码如下: <!DOCTYPE html PUBLIC &qu ...
BPM配置故事之案例7-公式计算
行政主管发来邮件.要求物资明细表增加"单价""总价"."单价"由其审批时填写,"总价"根据"单价"与 ...
AutoMapper使用中的问题
指定值只会执行一次 public class MomanBaseProfile : Profile { public MomanBaseProfile() { CreateMap<Request ...
数据库 oracle数据库基本知识
sqlplus登录普通用户登录 c:\>sqlplus 请输入用户名:scott 请输入口令: sqlplus scott/ quit退出管理员登录 sqlplus /nolog 连接数据库 ...

用python实现逻辑回归

用python实现逻辑回归的更多相关文章

随机推荐

热门专题