感知机算法（PLA）代码实现

1. 引言
2. 载入库和数据处理
3. 感知机的原始形式
4. 感知机的对偶形式
5. 多分类情况—one vs. rest
6. 多分类情况—one vs. one
7. sklearn实现
8. 感知机算法的作图

1. 引言

在这里主要实现感知机算法（PLA）的以下几种情况：

PLA算法的原始形式（二分类）
PLA算法的对偶形式（二分类）
PLA算法的作图（二维）
PLA算法的多分类情况（包括one vs. rest 和one vs. one 两种情况）
PLA算法的sklearn实现

为了方便起见，使用鸢尾花数据集进行PLA算法的验证。

2. 载入库和数据处理

# 载入库

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.datasets import load_iris

from sklearn.model_selection import train_test_split

from sklearn.linear_model import Perceptron

import warnings

warnings.filterwarnings("ignore")

# 设置图形尺寸

plt.rcParams["figure.figsize"] = [14, 7]

plt.rcParams["font.size"] = 14

# 载入鸢尾花数据集

iris_data = load_iris()

xdata = iris_data["data"]

ydata = iris_data["target"]

3. 感知机的原始形式

感知机的详细原理见我的前一篇博客

class model_perceptron(object):

    """

    功能：实现感知机算法

    参数 w：权重，默认都为None

    参数 b：偏置项，默认为0

    参数 alpha：学习率，默认为0.001

    参数 iter_epoch：迭代轮数，默认最大为1000

    """

    def __init__(self, w = None, b = 0, alpha = 0.001, max_iter_epoch = 1000):

        self.w = w

        self.b = b

        self.alpha = alpha

        self.max_iter_epoch = max_iter_epoch

    def linear_model(self, X):

        """功能：实现线性模型"""

        return np.dot(X, self.w) + self.b

    def fit(self, X, y):

        """

        功能：拟合感知机模型

        参数 X：训练集的输入数据

        参数 y：训练集的输出数据

        """

        # 按训练集的输入维度初始化w

        self.w = np.zeros(X.shape[1])

        # 误分类的样本就为True

        state = np.sign(self.linear_model(X)) != y

        # 迭代轮数

        total_iter_epoch = 1

        while state.any() and (total_iter_epoch <= self.max_iter_epoch):

            # 使用误分类点进行权重更新

            self.w += self.alpha * y[state][0] * X[state][0]

            self.b += self.alpha * y[state][0]

            # 状态更新

            total_iter_epoch += 1

            state = np.sign(self.linear_model(X)) != y

        print(f"fit model_perceptron(alpha = {self.alpha}, max_iter_epoch = {self.max_iter_epoch}, total_iter_epoch = {min(self.max_iter_epoch, total_iter_epoch)})")

    def predict(self, X):

        """

        功能：模型预测

        参数 X：测试集的输入数据

        """

        return np.sign(self.linear_model(X)) 

    def score(self, X, y):

        """

        功能：模型评价（准确率）

        参数 X：测试集的输入数据

        参数 y：测试集的输出数据

        """

        y_predict = self.predict(X)

        y_score = (y_predict == y).sum() / len(y)

        return y_score

# 二分类的情况（原始形式）/ 数据集的处理与划分

X = xdata[ydata < 2]

y = ydata[ydata < 2]

y = np.where(y == 0, -1, 1)

xtrain, xtest, ytrain, ytest = train_test_split(X, y)

# 原始形式的验证

ppn = model_perceptron()

ppn.fit(xtrain, ytrain)

ppn.predict(xtest)

ppn.score(xtest, ytest)

结果显示（由于随机划分数据集，运行结果不一定和图示相同）：

4. 感知机的对偶形式

class perceptron_dual(object):

    """

    功能：实现感知机的对偶形式

    参数 beta：每个实例点更新的次数组成的向量

    参数 w：权重，默认都为None

    参数 b：偏置项，默认为0

    参数 alpha：学习率，默认0.001

    参数 max_iter_epoch：最大迭代次数，默认为1000

    """

    def __init__(self, alpha = 0.001, max_iter_epoch = 1000):

        self.beta = None

        self.w = None

        self.b = 0

        self.alpha = alpha

        self.max_iter_epoch = max_iter_epoch

    def fit(self, X, y):

        # 实例点的数量

        xnum = X.shape[0]

        # 初始化

        self.beta = np.zeros(xnum)

        # gram矩阵

        gram = np.dot(X, X.T)

        # 迭代条件

        state = y*((self.beta * y * gram).sum(axis = 1) + self.b) <= 0

        iter_epoch = 1

        while state.any() and (iter_epoch <= self.max_iter_epoch):

            nx = X[state][0]

            ny = y[state][0]

            index = (X == nx).argmax()

            self.beta[index] += self.alpha

            self.b += ny

            # 更新条件

            iter_epoch += 1

            state = y*((self.beta * y * gram).sum(axis = 1) + self.b) <= 0

        # 通过beta计算出w

        self.w = ((self.beta * y).reshape(-1, 1) * X).sum(axis = 0)

        print(f"fit perceptron_dual(alpha = {self.alpha}, total_iter_epoch = {min(self.max_iter_epoch, iter_epoch)})")

    def predict(self, X):

        """

        功能：模型预测

        参数 X：测试集的输入数据

        """

        y_predict = np.sign(X @ self.w  + self.b)

        return y_predict

    def score(self, X, y):

        """

        功能：模型评价（准确率）

        参数 X：测试集的输入数据

        参数 y：测试集的输出数据

        """

        y_score = (self.predict(X) == y).sum() / len(y)

        return y_score

# 二分类的情况（对偶形式）/ 数据集的处理与划分

X = xdata[ydata < 2]

y = ydata[ydata < 2]

y = np.where(y == 0, -1, 1)

xtrain, xtest, ytrain, ytest = train_test_split(X, y)

# 对偶形式验证

ppn = perceptron_dual()

ppn.fit(xtrain, ytrain)

ppn.predict(xtest)

ppn.score(xtest, ytest)

结果显示（由于随机划分数据集，运行结果不一定和图示相同）：

5. 多分类情况—one vs. rest

假设有k个类别，ovr策略是生成k个分类器，最后选取概率最大的预测结果

class perceptron_ovr(object):

    """

    功能：实现感知机的多分类情形（采用one vs. rest策略）

    参数 w：权重，默认都为None

    参数 b：偏置项，默认为0

    参数 alpha：学习率，默认0.001

    参数 max_iter_epoch：最大迭代次数，默认为1000

    """

    def __init__(self, alpha = 0.001, max_iter_epoch = 1000):

        self.w = None

        self.b = None

        self.alpha = alpha

        self.max_iter_epoch = max_iter_epoch

    def linear_model(self, X):

        """功能：实现线性模型"""

        return np.dot(self.w, X.T) + self.b

    def fit(self, X, y):

        """

        功能：拟合感知机模型

        参数 X：训练集的输入数据

        参数 y：训练集的输出数据

        """

        # 生成各分类器对应的标记

        self.y_class = np.unique(y)

        y_ovr = np.vstack([np.where(y == i, 1, -1) for i in self.y_class])

        # 初始化w, b

        self.w = np.zeros([self.y_class.shape[0], X.shape[1]])

        self.b = np.zeros([self.y_class.shape[0], 1])

        # 拟合各分类器，并更新相应维度的w和b

        for index in range(self.y_class.shape[0]):

            ppn = model_perceptron(alpha = self.alpha, max_iter_epoch = self.max_iter_epoch)

            ppn.fit(X, y_ovr[index])

            self.w[index] = ppn.w

            self.b[index] = ppn.b

    def predict(self, X):

        """

        功能：模型预测

        参数 X：测试集的输入数据

        """

        # 值越大，说明第i维的分类器将该点分得越开，即属于该分类器的概率值越大

        y_predict = self.linear_model(X).argmax(axis = 0)

        # 还原原数据集的标签

        for index in range(self.y_class.shape[0]):

            y_predict = np.where(y_predict == index, self.y_class[index], y_predict)

        return y_predict

    def score(self, X, y):

        """

        功能：模型评价（准确率）

        参数 X：测试集的输入数据

        参数 y：测试集的输出数据

        """

        y_score = (self.predict(X) == y).sum()/len(y)

        return y_score

# 多分类数据集处理

xtrain, xtest, ytrain, ytest = train_test_split(xdata, ydata)

# one vs. rest的验证

ppn = perceptron_ovr()

ppn.fit(xtrain, ytrain)

ppn.predict(xtest)

ppn.score(xtest, ytest)

结果显示（由于随机划分数据集，运行结果不一定和图示相同）：

6. 多分类情况—one vs. one

假设有k个类别，生成k(k-1)/2个二分类器，最后通过多数投票来选取预测结果

from itertools import combinations

class perceptron_ovo(object):

    """

    功能：实现感知机的多分类情形（采用one vs. one策略）

    参数 w：权重，默认都为None

    参数 b：偏置项，默认为0

    参数 alpha：学习率，默认0.001

    参数 max_iter_epoch：最大迭代次数，默认为1000

    """

    def __init__(self, alpha = 0.001, max_iter_epoch = 1000):

        self.w = None

        self.b = None

        self.alpha = alpha

        self.max_iter_epoch = max_iter_epoch

    def linear_model(self, X):

        """功能：实现线性模型"""

        return np.dot(self.w, X.T) + self.b

    def fit(self, X, y):

        """

        功能：拟合感知机模型

        参数 X：训练集的输入数据

        参数 y：训练集的输出数据

        """

        # 生成各分类器对应的标记（使用排列组合）

        self.y_class = np.unique(y)

        self.y_combine = [i for i in combinations(self.y_class, 2)]

        # 初始化w和b

        clf_num = len(self.y_combine)

        self.w = np.zeros([clf_num, X.shape[1]])

        self.b = np.zeros([clf_num, 1])

        for index, label in enumerate(self.y_combine):

            # 根据各分类器的标签选取数据集

            cond = pd.Series(y).isin(pd.Series(label))

            xdata, ydata = X[cond], y[cond]

            ydata = np.where(ydata == label[0], 1, -1)

            # 拟合各分类器，并更新相应维度的w和b

            ppn = model_perceptron(alpha = self.alpha, max_iter_epoch = self.max_iter_epoch)

            ppn.fit(xdata, ydata)

            self.w[index] = ppn.w

            self.b[index] = ppn.b

    def voting(self, y):

        """

        功能：投票

        参数 y：各分类器的预测结果，接受的是元组如(1, 1, 2)

        """

        # 统计分类器预测结果的出现次数

        y_count = np.unique(np.array(y), return_counts = True)

        # 返回出现次数最大的结果位置索引

        max_index = y_count[1].argmax()

        # 返回某个实例投票后的结果

        y_predict = y_count[0][max_index]

        return y_predict

    def predict(self, X):

        """

        功能：模型预测

        参数 X：测试集的输入数据

        """

        # 预测结果

        y_predict = np.sign(self.linear_model(X))

        # 还原标签（根据排列组合的标签）

        for index, label in enumerate(self.y_combine):

            y_predict[index] = np.where(y_predict[index] == 1, label[0], label[1])

        # 列为某一个实例的预测结果，打包用于之后的投票

        predict_zip = zip(*(i.reshape(-1) for i in np.vsplit(y_predict, self.y_class.shape[0])))

        # 投票得到预测结果

        y_predict = list(map(lambda x: self.voting(x), list(predict_zip)))

        return np.array(y_predict)

    def score(self, X, y):

        """

        功能：模型评价（准确率）

        参数 X：测试集的输入数据

        参数 y：测试集的输出数据

        """

        y_predict = self.predict(X)

        y_score = (y_predict == y).sum() / len(y)

        return y_score

# 多分类数据集处理

xtrain, xtest, ytrain, ytest = train_test_split(xdata, ydata)

# one vs. one的验证

ppn = perceptron_ovo()

ppn.fit(xtrain, ytrain)

ppn.predict(xtest)

ppn.score(xtest, ytest)

结果显示（由于随机划分数据集，运行结果不一定和图示相同）：

准确率一般比one vs. rest要高，但是生成的分类器多

7. sklearn实现

主要使用sklearn中的Perceptron模块，其中可以实现多分类的情况（默认采用one vs. rest）

from sklearn.linear_model import Perceptron

xtrain, xtest, ytrain, ytest = train_test_split(xdata, ydata)

ppn = Perceptron(max_iter = 1000)

ppn.fit(xtrain, ytrain)

ppn.predict(xtest)

ppn.score(xtest, ytest)

结果显示：

8. 感知机算法的作图

from matplotlib.colors import ListedColormap

def decision_plot(X, Y, clf, test_idx = None, resolution = 0.02):

    """

    功能：画分类器的决策图

    参数 X：输入实例

    参数 Y：实例标记

    参数 clf：分类器

    参数 test_idx：测试集的index

    参数 resolution：np.arange的间隔大小

    """

    # 标记和颜色设置

    markers = ['o', 's', 'x', '^', '>']

    colors = ('red', 'blue', 'lightgreen', 'gray', 'cyan')

    cmap = ListedColormap(colors[:len(np.unique(Y))])

    # 图形范围

    xmin, xmax = X[:, 0].min() - 1, X[:, 0].max() + 1

    ymin, ymax = X[:, 1].min() - 1, X[:, 1].max() + 1

    x = np.arange(xmin, xmax, resolution)

    y = np.arange(ymin, ymax, resolution)

    # 网格

    nx, ny = np.meshgrid(x, y)

    # 数据合并

    xdata = np.c_[nx.reshape(-1), ny.reshape(-1)]

    # 分类器预测

    z = clf.predict(xdata)

    z = z.reshape(nx.shape)

    # 作区域图

    plt.contourf(nx, ny, z, alpha = 0.4, cmap = cmap)

    plt.xlim(nx.min(), nx.max())

    plt.ylim(ny.min(), ny.max())

    # 画点

    for index, cl in enumerate(np.unique(Y)):

        plt.scatter(x=X[Y == cl, 0], y=X[Y == cl, 1],

                    alpha=0.8, c = cmap(index),

                    marker=markers[index], label=cl)

    # 突出测试集的点

    if test_idx:

        X_test, y_test = X[test_idx, :], y[test_idx]

        plt.scatter(X_test[:, 0],

                    X_test[:, 1],

                    alpha=0.15,

                    linewidths=2,

                    marker='^',

                    edgecolors='black',

                    facecolors='none',

                    s=55, label='test set')

# 作图时的数据处理

X = xdata[ydata < 2, :2]

y = ydata[ydata < 2]

y = np.where(y == 0, -1, 1)

xtrain, xtest, ytrain, ytest = train_test_split(X, y)

ppn = model_perceptron()

ppn.fit(xtrain, ytrain)

decision_plot(X, y, ppn)

plt.legend()

结果显示：

感知机算法（PLA）代码实现的更多相关文章

机器学习---用python实现感知机算法和口袋算法（Machine Learning PLA Pocket Algorithm Application）
之前在<机器学习---感知机(Machine Learning Perceptron)>一文中介绍了感知机算法的理论知识,现在让我们来实践一下. 有两个数据文件:data1和data2,分 ...
机器学习算法--Perceptron(感知机)算法
感知机: 假设输入空间是$\chi\subseteq R^n$,输出空间是$\gamma =\left( +1,-1\right)$.输入$\chi\in X$表示实例的特征向量,对应于输 ...
DeepLearning tutorial（3）MLP多层感知机原理简介+代码详解
本文介绍多层感知机算法,特别是详细解读其代码实现,基于python theano,代码来自:Multilayer Perceptron,如果你想详细了解多层感知机算法,可以参考:UFLDL教程,或者参 ...
机器学习笔记（一）· 感知机算法 · 原理篇
这篇学习笔记强调几何直觉,同时也注重感知机算法内部的动机.限于篇幅,这里仅仅讨论了感知机的一般情形.损失函数的引入.工作原理.关于感知机的对偶形式和核感知机,会专门写另外一篇文章.关于感知机的实现代码 ...
感知机算法及BP神经网络
简介:感知机在1957年就已经提出,可以说是最为古老的分类方法之一了.是很多算法的鼻祖,比如说BP神经网络.虽然在今天看来它的分类模型在很多数时候泛化能力不强,但是它的原理却值得好好研究.先学好感知机 ...
Python实现各种排序算法的代码示例总结
Python实现各种排序算法的代码示例总结作者:Donald Knuth 字体:[增加减小] 类型:转载时间:2015-12-11我要评论这篇文章主要介绍了Python实现各种排序算法的代码示 ...
10个经典的C语言面试基础算法及代码
10个经典的C语言面试基础算法及代码作者:码农网 – 小峰原文地址:http://www.codeceo.com/article/10-c-interview-algorithm.html 算法是一 ...
经典面试题（二）附答案算法+数据结构+代码微软Microsoft、谷歌Google、百度、腾讯
1.正整数序列Q中的每个元素都至少能被正整数a和b中的一个整除,现给定a和b,需要计算出Q中的前几项, 例如,当a=3,b=5,N=6时,序列为3,5,6,9,10,12 (1).设计一个函数void ...
php四种排序算法实现代码
分享php排序的四种算法与代码. 冒泡:function bubble_sort($arr){ $num = count($arr); for($i=0;$i<$num;$i++){ for($ ...

随机推荐

ImageLoader在ViewPage中的使用
<?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android=&quo ...
关于html属性中onSubmit事件属性的使用
看到一段onSubmit事件属性的例子,如下: <!DOCTYPE html> <html> <head> <script> function vali ...
Python实用笔记（18）面向对象编程——类和实例
类和实例面向对象最重要的概念就是类(Class)和实例(Instance),必须牢记类是抽象的模板,比如Student类,而实例是根据类创建出来的一个个具体的“对象”,每个对象都拥有相同的方法,但各 ...
dart快速入门教程（8）
9.dart中的库 9.1.自定义库自定义库我们在前面已经使用过了,把某些功能抽取到一个文件,使用的时候通过import引入即可 9.2.系统内置库以math库为例: import "d ...
max depth exceeded when dereferencing c0-param0的问题
在做项目的时候,用到了dwr,有一次居然报错,错误是max depth exceeded when dereferencing c0-param0 上网查了一下,我居然传参数的时候传的是object类 ...
JavaScript基础对象创建模式之声明依赖模式(023)
运用了命名空间(Namespace)模式后, 就可以使用一些JavaScript库了,比如YAHOO作用YUI2库的全局对象,可以通过 YAHOO.util.Dom 和 YAHOO.util.Even ...
Python数据结构（二）
array固定类型的数据序列,与list类似,只不过成员必须是相同的基本类型 array.typecodes #包含所有可用类型代码的字符串bBuhHiIlLqQfd 输入代码 C型 Python类型 ...
vue.js之常操作（实例）
听说大家都开始用react.vue这些MVVM框架了,为了不落后,还是学学吧!(之前只对angular了解一点,时间一长,也忘得差不多了,所以学习vue相当于从小白开始) 从vue.js官网看一下,先 ...
Least Cost Bracket Sequence，题解
题目链接题意: 给你一个含有(,),?的序列,每个?变成(或)有一定的花费,问变成课匹配的括号的最小花费. 分析: 首先如果能变成匹配的,那么就有右括号的个数始终不多于左括号且左右括号数量相等,那就 ...
Azure Web App (一)发布你的Net Core Web 项目
一,引言今天我们看一下Azure上的一个服务-----Web 应用,我们都知道云计算的三大模式:Iaas(基础设施即服务),Paas(平台即服务),Saas(软件即服务). Iass,其实就是虚拟主 ...

感知机算法（PLA）代码实现

1. 引言

2. 载入库和数据处理

3. 感知机的原始形式

4. 感知机的对偶形式

5. 多分类情况—one vs. rest

6. 多分类情况—one vs. one

7. sklearn实现

8. 感知机算法的作图

感知机算法（PLA）代码实现的更多相关文章

随机推荐

热门专题