更新、更全的《机器学习》的更新网站，更有python、go、数据结构与算法、爬虫、人工智能教学等着你：https://www.cnblogs.com/nickchen121/p/11686958.html

Logistic回归(鸢尾花分类)

一、导入模块

import numpy as np

import matplotlib.pyplot as plt

from matplotlib.colors import ListedColormap

from matplotlib.font_manager import FontProperties

from sklearn import datasets

from sklearn.linear_model import LogisticRegression

%matplotlib inline

font = FontProperties(fname='/Library/Fonts/Heiti.ttc')

二、获取数据

iris_data = datasets.load_iris()

X = iris_data.data[:, [2, 3]]

y = iris_data.target

label_list = ['山鸢尾', '杂色鸢尾', '维吉尼亚鸢尾']

三、构建决策边界

def plot_decision_regions(X, y, classifier=None):

    marker_list = ['o', 'x', 's']

    color_list = ['r', 'b', 'g']

    cmap = ListedColormap(color_list[:len(np.unique(y))])

    x1_min, x1_max = X[:, 0].min()-1, X[:, 0].max()+1

    x2_min, x2_max = X[:, 1].min()-1, X[:, 1].max()+1

    t1 = np.linspace(x1_min, x1_max, 666)

    t2 = np.linspace(x2_min, x2_max, 666)

    x1, x2 = np.meshgrid(t1, t2)

    y_hat = classifier.predict(np.array([x1.ravel(), x2.ravel()]).T)

    y_hat = y_hat.reshape(x1.shape)

    plt.contourf(x1, x2, y_hat, alpha=0.2, cmap=cmap)

    plt.xlim(x1_min, x1_max)

    plt.ylim(x2_min, x2_max)

    for ind, clas in enumerate(np.unique(y)):

        plt.scatter(X[y == clas, 0], X[y == clas, 1], alpha=0.8, s=50,

                    c=color_list[ind], marker=marker_list[ind], label=label_list[clas])

四、训练模型

# C与正则化参数λ成反比，即减小参数C增大正则化的强度

# lbfgs使用拟牛顿法优化参数

# 分类方式为OvR（One-vs-Rest）

lr = LogisticRegression(C=100, random_state=1,

                        solver='lbfgs', multi_class='ovr')

lr.fit(X, y)

LogisticRegression(C=100, class_weight=None, dual=False, fit_intercept=True,

          intercept_scaling=1, max_iter=100, multi_class='ovr',

          n_jobs=None, penalty='l2', random_state=1, solver='lbfgs',

          tol=0.0001, verbose=0, warm_start=False)

4.1 C参数与权重系数的关系

weights, params = [], []

for c in np.arange(-5, 5):

    lr = LogisticRegression(C=10.**c, random_state=1,

                            solver='lbfgs', multi_class='ovr')

    lr.fit(X, y)

    # lr.coef_[1]拿到类别1的权重系数

    weights.append(lr.coef_[1])

    params.append(10.**c)

# 把weights转为numpy数组，即包含两个特征的权重的数组

weights = np.array(weights)

'''

params:

[1e-05, 0.0001, 0.001, 0.01, 0.1, 1.0, 10.0, 100.0, 1000.0, 10000.0]

'''

'''

weights:

[[ 2.50572107e-04  6.31528229e-05]

 [ 2.46565843e-03  6.15303747e-04]

 [ 2.13003731e-02  4.74899392e-03]

 [ 9.09176960e-02 -1.80703318e-03]

 [ 1.19168871e-01 -2.19313511e-01]

 [ 8.35644722e-02 -9.08030470e-01]

 [ 1.60682631e-01 -2.15860167e+00]

 [ 5.13026897e-01 -2.99137299e+00]

 [ 1.14643413e+00 -2.79518356e+00]

 [ 1.90317264e+00 -2.26818639e+00]]

'''

plt.plot(params, weights[:, 0], linestyle='--', c='r', label='花瓣长度（cm）')

plt.plot(params, weights[:, 1], c='g', label='花瓣长度（cm）')

plt.xlabel('C')

# 改变x轴的刻度

plt.xscale('log')

plt.ylabel('权重系数', fontproperties=font)

plt.legend(prop=font)

plt.show()

上图显示了10个不同的逆正则化参数C值拟合逻辑回归模型，此处只收集标签为1（杂色鸢尾）的权重系数。由于数据没有经过处理，所以显示的不太美观，但是总体趋势还是可以看出减小参数C会增大正则化强度，在$10^{-3}$的时候权重系数开始收敛为0。

五、可视化

plot_decision_regions(X, y, classifier=lr)

plt.xlabel('花瓣长度（cm）', fontproperties=font)

plt.ylabel('花瓣宽度（cm）', fontproperties=font)

plt.legend(prop=font)

plt.show()

02-15 Logistic回归(鸢尾花分类)的更多相关文章

【2008nmj】Logistic回归二元分类感知器算法.docx
给你一堆样本数据(xi,yi),并标上标签[0,1],让你建立模型(分类感知器二元),对于新给的测试数据进行分类. 要将两种数据分开,这是一个分类问题,建立数学模型,(x,y,z),z指示[0,1], ...
神经网络、logistic回归等分类算法简单实现
最近在github上看到一个很有趣的项目,通过文本训练可以让计算机写出特定风格的文章,有人就专门写了一个小项目生成汪峰风格的歌词.看完后有一些自己的小想法,也想做一个玩儿一玩儿.用到的原理是深度学习里 ...
Logistic回归二分类Winner or Losser----台大李宏毅机器学习作业二(HW2)
一.作业说明给定训练集spam_train.csv,要求根据每个ID各种属性值来判断该ID对应角色是Winner还是Losser(0.1分类). 训练集介绍: (1)CSV文件,大小为4000行X5 ...
《转》Logistic回归多分类问题的推广算法--Softmax回归
转自http://ufldl.stanford.edu/wiki/index.php/Softmax%E5%9B%9E%E5%BD%92 简介在本节中,我们介绍Softmax回归模型,该模型是log ...
如何在R语言中使用Logistic回归模型
在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价.身高.GDP.学生成绩等,发现这些被预测的变量都属于连续型变量.然而有些情况下,被预测变量可能是二元变量,即成功或失败.流失或 ...
机器学习之三：logistic回归(最优化)
一般来说,回归不用在分类问题上,因为回归是连续型模型,而且受噪声影响比较大.如果非要应用进入,可以使用logistic回归. logistic回归本质上是线性回归,只是在特征到结果的映射中加入了一层函 ...
七，专著研读（Logistic回归）
七,专著研读(Logistic回归) 分类:k-近邻算法,决策树,朴素贝叶斯,Logistic回归,支持向量机,AdaBoost算法. 运用 k-近邻算法,使用距离计算来实现分类决策树,构建直观的树 ...
Logistic回归应用-预测马的死亡率
Logistic回归应用-预测马的死亡率本文所有代码均来自<机器学习实战>,数据也是本例中的数据有以下几个特征: 部分指标比较主观.难以很好的定量测量,例如马的疼痛级别数据集中有30 ...
《Machine Learning in Action》—— Taoye给你讲讲Logistic回归是咋回事
在手撕机器学习系列文章的上一篇,我们详细讲解了线性回归的问题,并且最后通过梯度下降算法拟合了一条直线,从而使得这条直线尽可能的切合数据样本集,已到达模型损失值最小的目的. 在本篇文章中,我们主要是手撕 ...

随机推荐

adb 端口冲突
第一种方法:可以设置另一个端口第二种方法: http://blog.csdn.net/hwl1314/article/details/52538023 Android studio 5037端口被占 ...
【Spring】编程式事务和声明式事务
一.概述二.准备工作 1. 创建表 2. 创建项目并引入Maven依赖 3. 编写实体类 4. 编写Dao层 5. 业务层 6. XML中的配置 7. 测试三.编程式事务 1. 在业务层代码上使用 ...
MyBatis中#{}和${}的区别详解
首先看一下下面两个sql语句的区别: <select id="selectByNameAndPassword" parameterType="java.util.M ...
联想thinkpad如何关闭触摸板
Tinkpad系列很多关闭触摸屏的功能的方法都是没有的!!!比如说1.Fn+F6,或者Fn+某个按键...直接关闭没用比如说2.控制面板,鼠标/键盘,找到触摸开关...间接关闭没用比如说3.我的电脑, ...
java架构之路-（源码）mybatis的一二级缓存问题
上次博客我们说了mybatis的基本使用,我们还捎带提到一下Mapper.xml中的select标签的useCache属性,这个就是设置是否存入二级缓存的. 回到我们正题,经常使用mybatis的小伙 ...
HTML5为什么只需要写<!DOCTYPE HTML>?
HTML4.01中的doctype需要对DTD进行引用,因为HTML4.01基于SGML.而HTML5不基于SGML,因此不需要对DTD进行引用,但是需要doctype来规范浏览器的行为.其中,SGM ...
Escape （BFS + 模拟）
Problem Description The students of the HEU are maneuvering for their military training. The red arm ...
获取contenteditable区域光标所在位置信息
在我们使用contenteditable编辑时,有时需要光标位置的信息. <div contenteditable="true" style="min-height ...
TestNG（四）基本注解BeforeSuite和AfterSuite
package com.course.testng; import org.testng.annotations.*; public class BasicAnnotation { @Test //最 ...
53 (OC) 皮肤切换
1:添加皮肤 1.1:iOS皮肤切换方案 http://www.cocoachina.com/ios/20171012/20762.html 1.2:整合 iOS几种换肤思路和demo https:/ ...

02-15 Logistic回归(鸢尾花分类)