机器学习作业（二）逻辑回归—

题目太长啦！文档下载【传送门】

第1题

简述：实现逻辑回归。

此处使用了minimize函数代替Matlab的fminunc函数，参考了该博客【传送门】。

 import numpy as np

 import matplotlib.pyplot as plt

 import scipy.optimize as op

 #S函数

 def sigmoid(z):

     g = 1/(1+np.exp(-z))

     return g

 #cost计算函数

 def costFunction(theta, X, y):

     theta = np.array(theta).reshape((np.size(theta),1))

     m = np.size(y)

     h = sigmoid(np.dot(X, theta))

     J = 1/m*(-np.dot(y.T, np.log(h)) - np.dot((1-y.T), np.log(1-h)))

     return J.flatten()

 def gradient(theta, X, y):

     theta = np.array(theta).reshape((np.size(theta), 1))

     m = np.size(y)

     h = sigmoid(np.dot(X, theta))

     grad = 1/m*np.dot(X.T, h - y)

     return grad.flatten()

 #读取数据，第一列是成绩1，第二列是成绩2，第三列是yes/no

 data = np.loadtxt('ex2data1.txt', delimiter=',', dtype='float')

 m = np.size(data[:, 0])

 # print(data)

 #绘制样本点

 X = data[:, 0:2]

 y = data[:, 2:3]

 pos = np.where(y == 1)[0]

 neg = np.where(y == 0)[0]

 X1 = X[pos, 0:2]

 X0 = X[neg, 0:2]

 plt.plot(X1[:, 0], X1[:, 1], 'k+')

 plt.plot(X0[:, 0], X0[:, 1], 'yo')

 plt.xlabel('Exam 1 score')

 plt.ylabel('Exam 2 score')

 #求解最优解

 one = np.ones(m)

 X = np.insert(X, 0, values=one, axis=1)

 initial_theta = np.zeros(np.size(X, 1))

 result = op.minimize(fun=costFunction, x0=initial_theta, args=(X, y), method='TNC', jac=gradient)

 # print(result)

 theta = result.x

 cost = result.fun

 print('theta:', theta)

 print('cost:', cost)

 #绘制决策边界

 plot_x = np.array([np.min(X[:, 1]), np.max(X[:, 2])])

 # print(plot_x)

 plot_y = (-1/theta[2])*(theta[1]*plot_x+theta[0])

 # print(plot_y)

 plt.plot(plot_x,plot_y)

 plt.legend(labels=['Admitted', 'Not admitted'])

 plt.axis([30, 100, 30, 100])

 plt.show()

 #预测[45 85]成绩的学生，并计算准确率

 theta = np.array(theta).reshape((np.size(theta),1))

 z = np.dot([1, 45, 85], theta)

 prob = sigmoid(z)

 print('For a student with scores 45 and 85, we predict an admission probability of ', prob)

 p = np.round(sigmoid(np.dot(X,theta)))

 acc = np.mean(p==y)*100

 print('Train Accuracy: ',acc,'%')

运行结果：

第2题

简述：通过正规化实现逻辑回归。

 import numpy as np

 import matplotlib.pyplot as plt

 import scipy.optimize as op

 #S函数

 def sigmoid(z):

     g = 1/(1+np.exp(-z))

     return g

 #cost计算函数

 def costFunction(theta, X, y, lamb):

     theta = np.array(theta).reshape((np.size(theta), 1))

     m = np.size(y)

     h = sigmoid(np.dot(X, theta))

     J = 1/m*(-np.dot(y.T, np.log(h)) - np.dot((1-y.T), np.log(1-h)))

     # 添加项

     theta2 = theta[1:, 0]

     Jadd = lamb/(2*m)*np.sum(theta2**2)

     J = J + Jadd

     return J.flatten()

 #求梯度

 def gradient(theta, X, y, lamb):

     theta = np.array(theta).reshape((np.size(theta), 1))

     m = np.size(y)

     h = sigmoid(np.dot(X, theta))

     grad = 1/m*np.dot(X.T, h - y)

     #添加项

     theta[0,0] = 0

     gradadd = lamb/m*theta

     grad = grad + gradadd

     return grad.flatten()

 #求特征矩阵

 def mapFeature(X1, X2):

     degree = 6

     out = np.ones((np.size(X1),1))

     for i in range(1, degree+1):

         for j in range(0, i+1):

             res = np.multiply(np.power(X1, i-j), np.power(X2, j))

             out = np.insert(out, np.size(out[0, :]), values=res, axis=1)

     return out

 #读取数据，第一列是成绩1，第二列是成绩2，第三列是yes/no

 data = np.loadtxt('ex2data2.txt', delimiter=',', dtype='float')

 m = np.size(data[:, 0])

 #绘制样本点

 X = data[:, 0:2]

 y = data[:, 2:3]

 pos = np.where(y == 1)[0]

 neg = np.where(y == 0)[0]

 X1 = X[pos, 0:2]

 X0 = X[neg, 0:2]

 plt.plot(X1[:, 0], X1[:, 1], 'k+')

 plt.plot(X0[:, 0], X0[:, 1], 'yo')

 plt.xlabel('Microchip Test 1')

 plt.ylabel('Microchip Test 2')

 plt.legend(labels=['y = 1', 'y = 0'])

 #数据初始化

 X = mapFeature(X[:, 0], X[:, 1])

 # print(X)

 lamb = 1

 initial_theta = np.zeros(np.size(X, 1))

 #求解最优解

 result = op.minimize(fun=costFunction, x0=initial_theta, args=(X, y, lamb), method='TNC', jac=gradient)

 # print(result)

 cost = result.fun

 theta = result.x

 print('theta:', theta)

 print('cost:', cost)

 #绘制决策边界

 u = np.linspace(-1, 1.5, 50)

 v = np.linspace(-1, 1.5, 50)

 z = np.zeros((np.size(u),np.size(v)))

 theta = np.array(theta).reshape((np.size(theta), 1))

 for i in range(0, np.size(u)):

     for j in range(0, np.size(v)):

         z[i, j] = np.dot(mapFeature(u[i], v[j]), theta)

 # print(z)

 plt.contour(u, v, z.T, [0])

 plt.show()

 #计算准确率

 p = np.round(sigmoid(np.dot(X,theta)))

 acc = np.mean(p==y)*100

 print('Train Accuracy: ',acc,'%')

运行结果：

机器学习作业（二）逻辑回归——Python(numpy)实现的更多相关文章

机器学习二逻辑回归作业、逻辑回归（Logistic Regression）
机器学习二逻辑回归作业作业在这,http://speech.ee.ntu.edu.tw/~tlkagk/courses/ML_2016/Lecture/hw2.pdf 是区分spam的. 57 ...
机器学习总结之逻辑回归Logistic Regression
机器学习总结之逻辑回归Logistic Regression 逻辑回归logistic regression,虽然名字是回归,但是实际上它是处理分类问题的算法.简单的说回归问题和分类问题如下: 回归问 ...
机器学习算法整理（二）梯度下降求解逻辑回归 python实现
逻辑回归(Logistic regression) 以下均为自己看视频做的笔记,自用,侵删! 还参考了:http://www.ai-start.com/ml2014/ 用梯度下降求解逻辑回归 Logi ...
scikit-learn机器学习(二)逻辑回归进行二分类(垃圾邮件分类),二分类性能指标，画ROC曲线，计算acc,recall,presicion,f1
数据来自UCI机器学习仓库中的垃圾信息数据集数据可从http://archive.ics.uci.edu/ml/datasets/sms+spam+collection下载转成csv载入数据 im ...
Coursera-AndrewNg(吴恩达)机器学习笔记——第三周编程作业（逻辑回归）
一. 逻辑回归 1.背景:使用逻辑回归预测学生是否会被大学录取. 2.首先对数据进行可视化,代码如下: pos = find(y==); %找到通过学生的序号向量 neg = find(y==); % ...
【机器学习基础】逻辑回归——LogisticRegression
LR算法作为一种比较经典的分类算法,在实际应用和面试中经常受到青睐,虽然在理论方面不是特别复杂,但LR所牵涉的知识点还是比较多的,同时与概率生成模型.神经网络都有着一定的联系,本节就针对这一算法及其所 ...
Stanford机器学习---第三讲. 逻辑回归和过拟合问题的解决 logistic Regression & Regularization
原文:http://blog.csdn.net/abcjennifer/article/details/7716281 本栏目(Machine learning)包括单参数的线性回归.多参数的线性回归 ...
机器学习入门11 - 逻辑回归 (Logistic Regression)
原文链接:https://developers.google.com/machine-learning/crash-course/logistic-regression/ 逻辑回归会生成一个介于 0 ...
Spark机器学习(2)：逻辑回归算法
逻辑回归本质上也是一种线性回归,和普通线性回归不同的是,普通线性回归特征到结果输出的是连续值,而逻辑回归增加了一个函数g(z),能够把连续值映射到0或者1. MLLib的逻辑回归类有两个:Logist ...

随机推荐

Web移动前端开发-——bootstarp响应式框架
移动端WEB开发之响应式布局 1.0 响应式开发原理 1.1 响应式开发原理就是使用媒体查询针对不同宽度的设备进行布局和样式的设置,从而适配不同设备的目的. 设备的划分情况: 小于768的为超小屏幕 ...
Python当中的len(),str(),input(),print()函数当中值得注意的点
在python当中很多时候会用到这三个函数,这也是考试当中十分常见的考点,这里做一些记录: 1.len():用于测量变量当中的字符串/元组等的长度举个例子: >>> stt=&qu ...
升级了NinjaLoveFish Excel量化表格
为了方便查看均价和止盈值,新建了两列这样做的好处就是,针对一个股票,可以实现不同的多个网格布局,然后分别实现各自的盈利设定. 例如这是网格1 那么同时也可以存在网格2 就可以实现多个网格布局到一个股 ...
Java连载73-String方法简介
一.字符串常用的方法 package com.bjpowernode.java_learning; public class D73_StringMethodBriefIntroduction { ...
mysql必知必会--排序检索数据
排序数据其实,检索出的数据并不是以纯粹的随机顺序显示的.如果不排序,数据一般将以它在底层表中出现的顺序显示.这可以是数据最初添加到表中的顺序.但是,如果数据后来进行过更新或删除,则此顺序将会受 ...
PRML学习准备
因为很怕PRML课程,所以想提前学习下做点准备. 看的一个学习内容就是python数据处理那本书,比较仔细地学习了 numpy,大致看了pandas和 matplotlib ,有以下几点感受 nump ...
从HTML到node.js以及跨域问题的解决
废话不多说,直接上代码网页客户端 <!DOCTYPE html> <html> <head> <meta http-equiv="Content- ...
【感知机模型】手写代码训练 / 使用sklearn的Perceptron模块训练
读取原始数据 import pandas as pd import numpy as np in_data = pd.read_table('./origin-data/perceptron_15.d ...
Maven快速入门使用
1. Maven 介绍 1.1 为什么使用 Maven 由于 Java 的生态非常丰富,无论你想实现什么功能,都能找到对应的工具类,这些工具类都是以 jar 包的形式出现的,例如 Spring,Spr ...
电脑和手机上常用apk或Pc软件的重要目录或文件或文件夹路径
常用apk或Pc软件的重要目录或文件或文件夹路径 01.hosts文件位置在哪里 C:\Windows\System32\drivers\etc 02.Windows7的锁屏壁纸目录在哪 C:\Win ...

机器学习作业（二）逻辑回归——Python(numpy)实现

机器学习作业（二）逻辑回归——Python(numpy)实现的更多相关文章

随机推荐

热门专题