机器学习-softmax回归 python实现

---恢复内容开始---

Softmax Regression 可以看做是 LR 算法在多分类上的推广，即类标签 y 的取值大于或者等于 2。

假设数据样本集为：$\left \{ \left ( X^{(1)},y ^{(1)} \right ) ,\left ( X^{(2)},y ^{(2)} \right ),\left ( X^{(3)},y ^{(3)} \right ),...,\left ( X^{(m)},y ^{(m)} \right )\right \}$

对于 SR 算法，其输入特征为：$ X^{(i)} \in \mathbb{R}^{n+1}$，类别标记为：$y^{(i)} \in \{ 0,1,2,...,k \}$，假设函数为每一个样本估计其所属类别的概率 $P(y=j|X)$，具体的假设函数为：

$h_{\theta}(X^{(i)}) =\begin{bmatrix}
P(y^{(i)}=1|X^{(i)};\theta)\\
P(y^{(i)}=2|X^{(i)};\theta)\\
...\\
P(y^{(i)}=k|X^{(i)};\theta)
\end{bmatrix} = \frac{1}{\sum _{j=1}^{k}e^{\theta_j^TX^{(i)}}}\begin{bmatrix}
e^{\theta_1^TX^{(i)}}\\
e^{\theta_2^TX^{(i)}}\\
...\\
e^{\theta_k^TX^{(i)}}
\end{bmatrix}$

其中，$\theta$表示的向量，且 $\theta_i \in \mathbb{R}^{n+1}$，则对于每一个样本估计其所属的类别的概率为

$P(y^{(i)}=j|X^{(i)};\theta) = \frac{e^{\theta_j^TX^{(i)}}}{\sum _{l=1}^{k}e^{\theta_l^TX^{(i)}}}$

SR 的损失函数为：

$J(\theta) = -\frac{1}{m} \left [\sum_{i=1}^{m} \sum_{j=1}^{k} I \{ y^{(i)}=j \} \log \frac{e^{\theta_j^TX^{(i)}}}{\sum _{l=1}^{k}e^{\theta_l^TX^{(i)}}} \right ]$

其中，$I(x) = \left\{\begin{matrix}
0 & if\;\;x = false\\
1 & if\;\;x = true
\end{matrix}\right.$ 表示指示函数。

对于上述的损失函数，可以使用梯度下降法求解：

首先求参数的梯度：

$\frac{\partial J(\theta )}{\partial \theta _j} = -\frac{1}{m}\left [ \sum_{i=1}^{m}\triangledown _{\theta_j}\left \{ \sum_{j=1}^{k}I(y^{(i)}=j) \log\frac{e^{\theta_j^TX^{(i)}}}{\sum _{l=1}^{k}e^{\theta_l^TX^{(i)}}} \right \} \right ]$

当 $y^{(i)}=j$ 时， $\frac{\partial J(\theta )}{\partial \theta _j} = -\frac{1}{m}\sum_{i=1}^{m}\left [\left ( 1-\frac{e^{\theta_j^TX^{(i)}}}{\sum _{l=1}^{k}e^{\theta_l^TX^{(i)}}} \right )X^{(i)} \right ]$

当 $y^{(i)}\neq j$ 时，$\frac{\partial J(\theta )}{\partial \theta _j} = -\frac{1}{m}\sum_{i=1}^{m}\left [\left (-\frac{e^{\theta_j^TX^{(i)}}}{\sum _{l=1}^{k}e^{\theta_l^TX^{(i)}}} \right )X^{(i)} \right ]$

因此，最终结果为：

$g(\theta_j) = \frac{\partial J(\theta )}{\partial \theta _j} = -\frac{1}{m}\sum_{i=1}^{m}\left [X^{(i)} \cdot \left ( I\left \{ y^{(i)}=j \right \}-P( y^{(i)}=j|X^{(i)};\theta) \right ) \right ]$

梯度下降法的迭代更新公式为：

$\theta_j = \theta_j - \alpha \cdot g(\theta_j)$

主要python代码

def gradientAscent(feature_data,label_data,k,maxCycle,alpha):

    '''

    梯度下降求解Softmax模型

    :param feature_data: 特征

    :param label_data: 标签

    :param k: 类别个数

    :param maxCycle: 最大迭代次数

    :param alpha: 学习率

    :return: 权重

    '''

    m,n = np.shape(feature_data)

    weights = np.mat(np.ones((n,k))) #一共有n*k个权值

    i = 0

    while i <=maxCycle:

        i+=1

        err = np.exp(feature_data*weights) #e^(\theta_j * x^i)

        if i%100==0:

            print ("\t-----iter:",i,",cost:",cost(err,label_data))

        rowsum = -err.sum(axis = 1)

        rowsum = rowsum.repeat(k,axis = 1)

        err = err/rowsum  # -p(y^i = j|x^i;0)

        for x in range(m):

            err[x,label_data[x,0]]+=1 # I(y^i = j)-p(y^i = j|x^i;0)

        weights = weights+(alpha/m)*feature_data.T*err #weights

    return weights

def cost(err,label_data):

    '''

    计算损失函数值

    :param err: exp的值

    :param label_data: 标签值

    :return: sum_cost/m:损失函数值

    '''

    m = np.shape(err)[0]

    sum_cost = 0.0

    for i in xrange(m):

        if err[i,label_data[i,0]] / np.sum(err[i,:])>0:

            sum_cost -=np.log(err[i,label_data[i,0]]/np.sum(err[i,:]))

        else:

            sum_cost-=0

    return sum_cost/m

Sklearn代码：

lr = LogisticRegressionCV(fit_intercept=True, Cs=np.logspace(-5, 1, 100),

                          multi_class='multinomial', penalty='l2', solver='lbfgs',max_iter = 10000,cv = 7)#multinomial表示多类即softmax回归

re = lr.fit(X_train, Y_train)

机器学习-softmax回归 python实现的更多相关文章

机器学习——softmax回归
softmax回归前面介绍了线性回归模型适用于输出为连续值的情景.在另一类情景中,模型输出可以是一个像图像类别这样的离散值.对于这样的离散值预测问题,我们可以使用诸如 softmax 回归在内的分类 ...
机器学习 —— 基础整理（五）线性回归；二项Logistic回归；Softmax回归及其梯度推导；广义线性模型
本文简单整理了以下内容: (一)线性回归 (二)二分类:二项Logistic回归 (三)多分类:Softmax回归 (四)广义线性模型闲话:二项Logistic回归是我去年入门机器学习时学的第一个模 ...
手写数字识别 ----Softmax回归模型官方案例注释（基于Tensorflow,Python）
# 手写数字识别 ----Softmax回归模型 # regression import os import tensorflow as tf from tensorflow.examples.tut ...
机器学习之线性回归---logistic回归---softmax回归
在本节中,我们介绍Softmax回归模型,该模型是logistic回归模型在多分类问题上的推广,在多分类问题中,类标签可以取两个以上的值. Softmax回归模型对于诸如MNIST手写数字分类等问题 ...
机器学习算法与Python实践之（七）逻辑回归（Logistic Regression）
http://blog.csdn.net/zouxy09/article/details/20319673 机器学习算法与Python实践之(七)逻辑回归(Logistic Regression) z ...
机器学习(2)：Softmax回归原理及其实现
Softmax回归用于处理多分类问题,是Logistic回归的一种推广.这两种回归都是用回归的思想处理分类问题.这样做的一个优点就是输出的判断为概率值,便于直观理解和决策.下面我们介绍它的原理和实现. ...
机器学习之softmax回归笔记
本次笔记绝大部分转自https://www.cnblogs.com/Luv-GEM/p/10674719.html softmax回归 Logistic回归是用来解决二类分类问题的,如果要解决的问题是 ...
机器学习（三）—线性回归、逻辑回归、Softmax回归的区别
1.什么是回归? 是一种监督学习方式,用于预测输入变量和输出变量之间的关系,等价于函数拟合,选择一条函数曲线使其更好的拟合已知数据且更好的预测未知数据. 2.线性回归于一个一般的线性模型而言,其 ...
02-13 Softmax回归
目录 Softmax回归一.Softmax回归详解 1.1 让步比 1.2 不同类之间的概率分布 1.3 目标函数 1.4 目标函数最大化二.Softmax回归优缺点 2.1 优点 2.2 缺点 ...

随机推荐

【LeetCode】647. Palindromic Substrings 解题报告（Python）
[LeetCode]647. Palindromic Substrings 解题报告(Python) 标签: LeetCode 题目地址:https://leetcode.com/problems/p ...
C# 编写 Windows 动态桌面软件实现（一）之桌面交互功能
DreamScene2 1.3 版本已经发布了,现在支持鼠标和桌面交互功能.这个功能不会影响性能,基本不占用 CPU.这个功能让我对 Windows 消息机制有了更深入的理解,在这篇博客中我会详细介绍 ...
Java 将Excel转为OFD
OFD是一种开放版式文档(Open Fixed-layout Document )的英文缩写,是我国国家版式文档格式标准.本文,通过Java后端程序代码展示如何将Excel转为OFD格式.方法步骤如下 ...
业务层面和运维层面优化你的Redis
业务层面 key的长度尽量要短,在数据量非常大时,过长的key名会占用更多的内存; 一定避免存储过大的数据(大value),过大的数据在分配内存和释放内存时耗时严重,会阻塞主线程; Redis 4.0 ...
Chapter 5 Interaction
目录 5.1 Interaction requires a joint intervention 5.2 Identifying interaction 5.3 Counterfactual resp ...
登陆认证框架：SpringSecurity
最近想给自己的小系统搭建一个登录认证服务,最初是想着一套oauth2权鉴就可以,但是发现这个oauth2只是权鉴,具体的登录认证需要由 SpringSecurity来进行实现. 也就是说SpringS ...
每天学一点——while循环（2）、for循环
while循环(2) while+continue 打印数字的话相信朋友们在python中不会一个个的print吧 eg: 或者是打印列表里的元素 eg 这种方法只适用于你知道里面有多少个元素, 不然 ...
linux 之 nginx安装步骤
配置规划用户 lzh 用户目录 /lzh 下载进入官网下载nginx http://nginx.org/download/ 安装解压 cd /lzh/app tar -zxvf nginx-1 ...
Python_getattr+__import__ 实现动态加载模块、类对象或函数
__import__() 语法 __import__(name[, globals[, locals[, fromlist[, level]]]]) 参数 name -- 字符串,模块的导入路径说明 ...
Centos7 文件权限理解（持续更新）
后期排版,边学边记边敲用户详情分析管理员用户 root 0 虚拟用户 nobody 1-999 普通用户 test001 1000+ 输入ll命令查看当前目录文件详情根据这张图片可知,目录 ...

机器学习-softmax回归 python实现

机器学习-softmax回归 python实现的更多相关文章

随机推荐

热门专题