python实现逻辑回归

首先得明确逻辑回归与线性回归不同，它是一种分类模型。而且是一种二分类模型。

首先我们需要知道sigmoid函数，其公式表达如下：

其函数曲线如下：

sigmoid函数有什么性质呢？

1、关于（0,0.5）对称

2、值域范围在(0,1)之间

3、单调递增

4、光滑

5、中间较陡，两侧较平缓

6、其导数为g(z)(1-g(z))，即可以用原函数直接计算

于是逻辑回归的函数形式可以用以下公式表示：

其中θ表示权重参数，x表示输入。θTx为决策边界，就是该决策边界将不同类数据区分开来。

为什么使用sigmoid函数呢？

1、sigmoid函数本身的性质

2、推导而来

我们知道伯努利分布：

当x=1时，f(1|p) =p，当x=0时，f(0|p)=1-p

首先要明确伯努利分布也是指数族，指数族的一般表达式为：

由于：

则有：

所以：

因为：

则有：

逻辑回归代价函数：

为什么这么定义呢？

以单个样本为例：

上面式子等价于：

当y=1时，其图像如下：

也就是说当hθ(x)的值越接近1，C(θ) 的值就越小。

同理当y=0时，其图像如下：

也就是说当hθ(x)的值越接近0，C(θ) 的值就越小。

这样就可以将不同类区分开来。

代价函数的倒数如下：

推导过程如下：

上面参考了：

https://blog.csdn.net/sun_wangdong/article/details/80780368

https://zhuanlan.zhihu.com/p/28415991

接下来就是代码实现了，代码来源： https://github.com/eriklindernoren/ML-From-Scratch

from __future__ import print_function, division

import numpy as np

import math

from mlfromscratch.utils import make_diagonal, Plot

from mlfromscratch.deep_learning.activation_functions import Sigmoid

class LogisticRegression():

    """ Logistic Regression classifier.

    Parameters:

    -----------

    learning_rate: float

        The step length that will be taken when following the negative gradient during

        training.

    gradient_descent: boolean

        True or false depending if gradient descent should be used when training. If

        false then we use batch optimization by least squares.

    """

    def __init__(self, learning_rate=.1, gradient_descent=True):

        self.param = None

        self.learning_rate = learning_rate

        self.gradient_descent = gradient_descent

        self.sigmoid = Sigmoid()

    def _initialize_parameters(self, X):

        n_features = np.shape(X)[1]

        # Initialize parameters between [-1/sqrt(N), 1/sqrt(N)]

        limit = 1 / math.sqrt(n_features)

        self.param = np.random.uniform(-limit, limit, (n_features,))

    def fit(self, X, y, n_iterations=4000):

        self._initialize_parameters(X)

        # Tune parameters for n iterations

        for i in range(n_iterations):

            # Make a new prediction

            y_pred = self.sigmoid(X.dot(self.param))

            if self.gradient_descent:

                # Move against the gradient of the loss function with

                # respect to the parameters to minimize the loss

                self.param -= self.learning_rate * -(y - y_pred).dot(X)

            else:

                # Make a diagonal matrix of the sigmoid gradient column vector

                diag_gradient = make_diagonal(self.sigmoid.gradient(X.dot(self.param)))

                # Batch opt:

                self.param = np.linalg.pinv(X.T.dot(diag_gradient).dot(X)).dot(X.T).dot(diag_gradient.dot(X).dot(self.param) + y - y_pred)

    def predict(self, X):

        y_pred = np.round(self.sigmoid(X.dot(self.param))).astype(int)

        return y_pred

说明：np.linalg.pinv()用于计算矩阵的pseudo-inverse（伪逆）。第一种方法求解使用随机梯度下降。

其中make_diagonal()函数如下：用于将向量转换为对角矩阵

def make_diagonal(x):

    """ Converts a vector into an diagonal matrix """

    m = np.zeros((len(x), len(x)))

    for i in range(len(m[0])):

        m[i, i] = x[i]

    return m

其中Sigmoid代码如下：

class Sigmoid():

    def __call__(self, x):

        return 1 / (1 + np.exp(-x))

    def gradient(self, x):

        return self.__call__(x) * (1 - self.__call__(x))

最后是主函数运行代码：

from __future__ import print_function

from sklearn import datasets

import numpy as np

import matplotlib.pyplot as plt

# Import helper functions

import sys

sys.path.append("/content/drive/My Drive/learn/ML-From-Scratch/")

from mlfromscratch.utils import make_diagonal, normalize, train_test_split, accuracy_score

from mlfromscratch.deep_learning.activation_functions import Sigmoid

from mlfromscratch.utils import Plot

from mlfromscratch.supervised_learning import LogisticRegression

def main():

    # Load dataset

    data = datasets.load_iris()

    X = normalize(data.data[data.target != 0])

    y = data.target[data.target != 0]

    y[y == 1] = 0

    y[y == 2] = 1

    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, seed=1)

    clf = LogisticRegression(gradient_descent=True)

    clf.fit(X_train, y_train)

    y_pred = clf.predict(X_test)

    accuracy = accuracy_score(y_test, y_pred)

    print ("Accuracy:", accuracy)

    # Reduce dimension to two using PCA and plot the results

    Plot().plot_in_2d(X_test, y_pred, title="Logistic Regression", accuracy=accuracy)

if __name__ == "__main__":

    main()

结果：

Accuracy: 0.9393939393939394

python实现逻辑回归的更多相关文章

机器学习_线性回归和逻辑回归_案例实战：Python实现逻辑回归与梯度下降策略_项目实战：使用逻辑回归判断信用卡欺诈检测
线性回归: 注:为偏置项,这一项的x的值假设为[1,1,1,1,1....] 注:为使似然函数越大,则需要最小二乘法函数越小越好线性回归中为什么选用平方和作为误差函数?假设模型结果与测量值误差满足 ...
机器学习之使用Python完成逻辑回归
一.任务基础我们将建立一个逻辑回归模型来预测一个学生是否被大学录取.假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人的录取机会.你有以前的申请人的历史数据,你可以用它作为逻辑回归的 ...
吴裕雄 python 机器学习——逻辑回归
import numpy as np import matplotlib.pyplot as plt from matplotlib import cm from mpl_toolkits.mplot ...
Python之逻辑回归模型来预测
建立一个逻辑回归模型来预测一个学生是否被录取. import numpy as np import pandas as pd import matplotlib.pyplot as plt impor ...
python机器学习-逻辑回归
1.逻辑函数假设数据集有n个独立的特征,x1到xn为样本的n个特征.常规的回归算法的目标是拟合出一个多项式函数,使得预测值与真实值的误差最小: 而我们希望这样的f(x)能够具有很好的逻辑判断性质,最 ...
python机器学习——逻辑回归
我们知道感知器算法对于不能完全线性分割的数据是无能为力的,在这一篇将会介绍另一种非常有效的二分类模型--逻辑回归.在分类任务中,它被广泛使用逻辑回归是一个分类模型,在实现之前我们先介绍几个概念: 几 ...
Python使用逻辑回归估算OR值
第一种是统计学方法,需要用到 statsmodels包 statsmodels是统计和计量经济学的package,包含了用于参数评估和统计测试的实用工具第二种是机器学习,需要使用sklearn中的L ...
用python实现逻辑回归
机器学习课程的一个实验,整理出来共享. 原理很简单,优化方法是用的梯度下降.后面有测试结果. # coding=utf-8 from math import exp import matplotlib ...
Python之逻辑回归
代码: import numpy as np from sklearn import datasets from sklearn.linear_model import LogisticRegress ...

随机推荐

面试官：JavaScript 原始数据类型 Symbol 有什么用？
以前提到 JavaScript 原始数据类型时,我们知道有Number,String,Null,Boolean,Undefined这几种.ES6 引入了新的基本数据类型Symbol和BigInt.今天 ...
iOS开发|从小公司到进大厂，我的进阶学习之旅！
iOS高级进发 OC源码下载地址苹果开发文档如何阅读苹果开发文档 GNUstep是GNU计划的项目之一,它将Cocoa的OC库重新开源实现了一遍源码地址:http://www.gnustep.o ...
G1垃圾回收器
垃圾回收器的发展历程背景 01.G1解决的问题 G1垃圾回收器是04年正式提出,12开始正式支持,在17年作为JDK9默认的垃圾处理器. 在04年的时候,java程序堆的内存越来越大,从而导致程序中 ...
Scratch 第4课满天星
素材及视频下载链接:https://pan.baidu.com/s/1qX0T2B_zczcLaCCpiRrsnA提取码:xfp8
[SCF+wetest+jmeter]简单云性能压测工具使用方案
前言压测太难?局域网压力无法判断服务器网络指标?无法产生非常大的并发量?云性能太贵? 也许我们可以把各种简单的工具拼起来进行压力测试! 准备 https://cloud.tencent.com/pr ...
Linux网络安全篇,配置Yum源（二），阿里Yum源
官网教程: https://opsx.alibaba.com/mirror 1.下载配置文件到 /etc/yum.repos.d 目录 wget -O /etc/yum.repos.d/CentOS- ...
Flask(python web) 处理表单和Ajax请求
1.处理表单(form) 首先,编一个简单的html登录页面(名字为login.html(根路由jinjia2模板指定)): <html> <head> <meta ch ...
javascript入门之 ztree (九单/复选框问题)
<!DOCTYPE html> <HTML> <HEAD> <meta http-equiv="content-type" content ...
Jenkins构建项目后发送钉钉消息推送
前言钉钉是我们日常工作的沟通工具,在Jenkins构建持续集成项目配合钉钉机器人的功能,可以让我们在持续集成测试环节快速接收到测试结果的消息推送. 一:新建一个钉钉群,选择自定义机器人二:添加机器 ...
10.2 io流之字节流和字符流
FileWriter 用于写入字符流.要写入原始字节流,请考虑使用 FileOutputStream. io流相关文档: https://www.cnblogs.com/albertrui/p/836 ...

python实现逻辑回归

python实现逻辑回归的更多相关文章

随机推荐

热门专题