2.2、Softmax Regression算法实践

Softmax Regression算法实践

　　有了上篇博客的理论知识，我们可以利用实现好的函数，来构建Softmax Regression分类器，在训练分类器的过程中，我们使用多分类数据作为训练数据：如图

1、利用训练数据对模型进行训练：

完整代码为：

 # -*- coding: UTF- -*-

 # date://

 # User:WangHong

 import numpy as np

 def gradientAscent(feature_data,label_data,k,maxCycle,alpha):

     '''利用梯度下降法训练Softmax模型

     :param feature_data: 特征

     :param label_data: 标签

     :param k: 类别个数

     :param maxCycle: 最大迭代次数

     :param alpha: 学习率

     :return weights: 权重

     '''

     m,n = np.shape(feature_data)

     weights = np.mat(np.ones((n,k)))#初始化权重

     i =

     while i<=maxCycle:

         err = np.exp(feature_data*weights)

         if i %  == :

             print("\t--------iter:",i,\

                   ",cost:",cost(err,label_data))

         rowsum = -err.sum(axis=)

         rowsum = rowsum.repeat(k,axis = )

         err = err/rowsum

         for x in range(m):

             err[x,label_data[x,]]+=

         weights = weights+(alpha/m)*feature_data.T*err

         i+=

     return  weights

 def cost(err,label_data):

     '''

     :param err: exp的值

     :param label_data: 标签的值

     :return: 损失函数的值

     '''

     m = np.shape(err)[]

     sum_cost = 0.0

     for i in range(m):

         if err[i,label_data[i,]]/np.sum(err[i,:])>:

             sum_cost -=np.log(err[i,label_data[i,]]/np.sum(err[i,:]))

         else:

             sum_cost -=

     return sum_cost / m

 def load_data(inputfile):

     '''导入训练数据

     input:  inputfile(string)训练样本的位置

     output: feature_data(mat)特征

             label_data(mat)标签

             k(int)类别的个数

     '''

     f = open(inputfile)  # 打开文件

     feature_data = []

     label_data = []

     for line in f.readlines():

         feature_tmp = []

         feature_tmp.append()  # 偏置项

         lines = line.strip().split("\t")

         for i in range(len(lines) - ):

             feature_tmp.append(float(lines[i]))

         label_data.append(int(lines[-]))

         feature_data.append(feature_tmp)

     f.close()  # 关闭文件

     return np.mat(feature_data), np.mat(label_data).T, len(set(label_data))

 def save_model(file_name, weights):

     '''保存最终的模型

     input:  file_name(string):保存的文件名

             weights(mat):softmax模型

     '''

     f_w = open(file_name, "w")

     m, n = np.shape(weights)

     for i in range(m):

         w_tmp = []

         for j in range(n):

             w_tmp.append(str(weights[i, j]))

         f_w.write("\t".join(w_tmp) + "\n")

     f_w.close()

 if __name__=="__main__":

     inputfile = "SoftInput.txt"

     #导入数据

     print("--------------1.load data-------------")

     feature,label,k = load_data(inputfile)

     #训练模型

     print("--------------2.traing----------------")

     weights = gradientAscent(feature,label,k,,0.2)

     #保存模型

     print("--------------3.save model------------")

     save_model("weights",weights)

训练结果为

weights文件内容

2、用训练好的模型对数据进行预测：

预测的代码：

 # -*- coding: UTF-8 -*-

 # date:2018/5/29

 # User:WangHong

 import numpy as np

 import random as rd

 def load_weights(weights_path):

     '''导入训练好的Softmax模型

     input:  weights_path(string)权重的存储位置

     output: weights(mat)将权重存到矩阵中

             m(int)权重的行数

             n(int)权重的列数

     '''

     f = open(weights_path)

     w = []

     for line in f.readlines():

         w_tmp = []

         lines = line.strip().split("\t")

         for x in lines:

             w_tmp.append(float(x))

         w.append(w_tmp)

     f.close()

     weights = np.mat(w)

     m, n = np.shape(weights)

     return weights, m, n

 def load_data(num, m):

     '''导入测试数据

     input:  num(int)生成的测试样本的个数

             m(int)样本的维数

     output: testDataSet(mat)生成测试样本

     '''

     testDataSet = np.mat(np.ones((num, m)))

     for i in range(num):

         testDataSet[i, 1] = rd.random() * 6 - 3  # 随机生成[-3,3]之间的随机数

         testDataSet[i, 2] = rd.random() * 15  # 随机生成[0,15]之间是的随机数

     return testDataSet

 def predict(test_data, weights):

     '''利用训练好的Softmax模型对测试数据进行预测

     input:  test_data(mat)测试数据的特征

             weights(mat)模型的权重

     output: h.argmax(axis=1)所属的类别

     '''

     h = test_data * weights

     return h.argmax(axis=1)  # 获得所属的类别

 def save_result(file_name, result):

     '''保存最终的预测结果

     input:  file_name(string):保存最终结果的文件名

             result(mat):最终的预测结果

     '''

     f_result = open(file_name, "w")

     m = np.shape(result)[0]

     for i in range(m):

         f_result.write(str(result[i, 0]) + "\n")

     f_result.close()

 if __name__ == "__main__":

     # 1、导入Softmax模型

     print("---------- 1.load model ----------------")

     w, m, n = load_weights("weights")

     # 2、导入测试数据

     print("---------- 2.load data -----------------")

     test_data = load_data(4000, m)

     # 3、利用训练好的Softmax模型对测试数据进行预测

     print("---------- 3.get Prediction ------------")

     result = predict(test_data, w)

     # 4、保存最终的预测结果

     print("---------- 4.save prediction ------------")

     save_result("result", result)

预测结果;

会生成一个result文件用于存储预测结果

在本次测试中随机生成4000个样本，最终分类的结果为：

2.2、Softmax Regression算法实践的更多相关文章

1.2、Logistics Regression算法实践
1.1.Logistics Regression算法实践有了上篇博客的理论准备后,接下来,我们用以及完成的函数,构建Logistics Regression分类器.我们利用线性可分的数据作为训练样 ...
学习笔记TF024:TensorFlow实现Softmax Regression(回归)识别手写数字
TensorFlow实现Softmax Regression(回归)识别手写数字.MNIST(Mixed National Institute of Standards and Technology ...
2.1、Softmax Regression模型
Softmax Regression模型由于Logistics Regression算法复杂度低,容易实现等特点,在工业中的到广泛的使用,但是Logistics Regression算法主要用于处理 ...
TensorFlow实现Softmax Regression识别手写数字
本章已机器学习领域的Hello World任务----MNIST手写识别做为TensorFlow的开始.MNIST是一个非常简单的机器视觉数据集,是由几万张28像素*28像素的手写数字组成,这些图片只 ...
ufldl学习笔记和编程作业：Softmax Regression（softmax回报）
ufldl学习笔记与编程作业:Softmax Regression(softmax回归) ufldl出了新教程.感觉比之前的好,从基础讲起.系统清晰,又有编程实践. 在deep learning高质量 ...
ufldl学习笔记与编程作业：Softmax Regression(vectorization加速)
ufldl学习笔记与编程作业:Softmax Regression(vectorization加速) ufldl出了新教程,感觉比之前的好.从基础讲起.系统清晰,又有编程实践. 在deep learn ...
Softmax回归（Softmax Regression）
转载请注明出处:http://www.cnblogs.com/BYRans/ 多分类问题在一个多分类问题中,因变量y有k个取值,即.例如在邮件分类问题中,我们要把邮件分为垃圾邮件.个人邮件.工作邮件 ...
（六）6.10 Neurons Networks implements of softmax regression
softmax可以看做只有输入和输出的Neurons Networks,如下图: 其参数数量为k*(n+1) ,但在本实现中没有加入截距项,所以参数为k*n的矩阵. 对损失函数J(θ)的形式有: 算法 ...
UFLDL实验报告1： Softmax Regression
PS:这些是今年4月份,跟斯坦福UFLDL教程时的实验报告,当时就应该好好整理的…留到现在好凌乱了 Softmax Regression实验报告 1.Softmax Regression实验描述 So ...

随机推荐

Python基础学习六操作MySQL
python操作数据库,需要先安装模块 1.下载MySQL.Redis模块 2.解压后,在当前目录执行 python setup.py install 3.或是pycharm直接选择安装 import ...
21-从零玩转JavaWeb-多态详解
配套视频详解多态思想 eclipse快捷键设置多态的好处多态方法调用 instanceof关键字多态中字段注意点一.什么是多态既然子类是一种特殊的父类那么我们可不可以认为狗 ...
SESSION的知识
android模拟表单用到了httpclient,但是需要了解Jsessionid的相关知识如下是从一篇博文摘抄来的在web应用的开发中我们会经常看到这样的url:http://www.xxx.c ...
Resin 的watchdog(看门狗)介绍和resin负载均衡实现
为了稳定和安全,Resin使用一个独立的watchdog进程来启动和监视Resin服务器.watchdog连续你检测Resin服务器的状态,如果其没有反应或者迟钝,将会重启Resin服务器进程.大多数 ...
关于PHP的一个坑爹问题（页面刷新）
最近在用PHP做一个服务端和一个客户端,在快要完工的时候,出现了一个重大问题---- 当在客户端手动输入IP和端口的时候,一按连接,OK,连接成功,嘻嘻,就在我自以为大功告成的时候,来了个晴天霹雳,一 ...
利用HttpWebRequest类Post数据至URI
在与第三方系统进行数据对接时,需要把数据post到对方提供的一个url,然后进行相关处理. 这里可利用HttpWebRequest类,该类位于System.Net命名空间下.它提供了一些属性和方法可以 ...
poj 1988 Cube Stacking （并查集）
题意:有N(N<=30,000)堆方块,开始每堆都是一个方块.方块编号1 – N. 有两种操作: M x y : 表示把方块x所在的堆,拿起来叠放到y所在的堆上. C x : 问方块x下面有多少 ...
Qt工程文件Pro介绍（转）
转载请注明:http://blog.163.com/hu_cuit/blog/static/122849143201127104232142/ 我也才开始学习QT的菜鸟.但是前几天有同学叫我给他讲一下 ...
ThinkPHP5权限控制
我在用ThinkPHP5做开发的时候发现,它没有权限类,自己写太麻烦,于是就想到了把TP3里面的权限类拿来修改使用,结果这种方法是可行的,下面记录附上修改后的Auth.php权限类 <?php ...
进程间传递文件描述符fd
众所周知,子进程会继承父进程已经打开的文件描述符fd,但是fork之后的是不会被继承的,这个时候是否无能无力了?答应是NO.Linux提供了一个系统调用sendmsg,借助它,可以实现进程间传递文件描 ...

2.2、Softmax Regression算法实践

2.2、Softmax Regression算法实践的更多相关文章

随机推荐

热门专题