Python_sklearn机器学习库学习笔记（七）the perceptron(感知器）

　　一、感知器

　　感知器是Frank Rosenblatt在1957年就职于Cornell航空实验室时发明的，其灵感来自于对人脑的仿真，大脑是处理信息的神经元（neurons）细胞和链接神经元细胞进行信息传递的突触（synapses）构成。

　　一个神经元可以看做将一个或者多个输入处理成一个输出的计算单元。一个感知器函数类似于一个神经元：它接受一个或多个输入，处理

他们然后返回一个输出。神经元可以实时，错误驱动的学习，神经元可以通过一个训练样本不断的更新参数，而非一次使用整套的数据。实时学习可能有效的处理内存无法容纳的大数据。感知器通常用下面的图形表示：

　　x1,x2,x3是输入单元，每个输入单元分别代表一个特征。感知器通常用另外一个输入单元代表一个常用的误差项，但是这个输入单元在图形中通常被忽略了。中间的圆圈是一个计算单元，类似神经元的细胞核。链接输入单元和计算单元的边类似于树突。每条边一个权重，或者一个参数。参数容易解释，如果某个解释变量与阳性类型相关，权重为正，某个解释变量与阴性类型相关，其其权重为负。链接计算单元和输出单元的边类似树突。

　　二、激励函数

　　感知器通过使用激励函数（activeation function）处理解释变量和模型参数的线性组合对样本分类，计算公式如下所示。解释变量和模型参数的线性组合有时也称为感知器的预激励（preactivation）。

　　其中，w_i是模型参数，b是常误差项，Φ()是激励方程。常用的激励方程有几种。Rosenblatt最初的感知器用的阶跃函数（Heaviside step function或unit step function）作为激励函数。函数公式如下：

　　如果加权解释变量的和加上常误差项之和大于0，则激励方程返回1，此时感知器就把样本归类为阳性。否则，激励方程返回0，感知器就把样本归类为阴性。阶跃函数图形如下所示：

　　另一个常用的激励函数是逻辑S形（logistic sigmoid）激励函数。这个激励函数的梯度分布可以更有效的计算，在处理后面的ANN算法是十分有效。其计算公式如下：

　　其中，x是加权输入的和。这个模型与第四章的逻辑方程类似，是解释变量值与模型参数的线性组合，与逻辑回归模型一样。虽然用逻辑S形激励函数的感知器与逻辑回归一样，但是要估计的参数不同。

　　三、感知器学习算法

　　感知器算法首先需要将权重设置为0或者很小的随机数，然后预测训练样本的类型。感知器是一种错误驱动（error-driven）的学习算法。如果感知器是正确的，算法就继续处理下一样本。如果感知器是错误的，算法就更新权重，重新预测。权重的更新规则如下：

　　对于每个训练样本来说，每个解释变量的参数值增加α（d_j-y_j(t)）x_j,i,d_j是样本j的真实类型，y_j(t)是样本j的预测类型，x_j,i是第i个样本j的解释变量的值，α是控制学习速率的超参数。如果预测正确的，d_j-y_j(t)等于0，α（d_j-y_j(t)）x_j,i也是0，此时，权重不更新。如果预测错误的，权重会按照学习速率，（d_j-y_j(t)）与解释变量的值的乘积增加。

　　这里更新的规则与梯度下降法中的权重更新规则类似，都是朝着使样本得到正确分类更新，且更新的幅度是由学习速率控制的。每次遍历一次训练样本成为完成了一世代（epoch）。如果学习完一世代后，所有的样本都正确分类，那么算法会收敛（converge）。学习算法不能保证收敛（例如线性不可分的数据集），因此学习算法还需要一个超参数，算法终止前需要更新的最大世代数

　　感知器的二元分类

　　下面我们来解决一个分类的案例。假设想从一堆的猫中分辨幼猫和成年猫。数据只有两个解释变量：用来睡觉的天数比例，闹脾气的天数比例。训练数据由下面四个样本构成：

　　下面的散点图表示这些样本是可以线性可分离的：

In [2]: import matplotlib.pyplot as plt

In [3]: from matplotlib.font_manager import FontProperties

In [4]: font = FontProperties(fname = r"c:\windows\fonts\msyh.ttc",size = 10)

In [5]: import numpy as np

In [6]: X = np.array([[0.2,0.1],[0.4,0.6],[0.5,0.2],[0.7,0.9]])

In [7]: y = [0,0,0,1]

In [8]: marker = ['.','x']

In [9]: plt.scatter(X[:3,0],X[:3,1],marker=',',s=400)

Out[9]: <matplotlib.collections.PathCollection at 0x6d46208>

In [10]: plt.scatter(X[3,0],X[3,1],marker='x',s=400)

Out[10]: <matplotlib.collections.PathCollection at 0x6c856a0>

In [11]: plt.xlabel(u'用来睡觉的天数比例',fontproperties = font)

Out[11]: <matplotlib.text.Text at 0x6c9eeb8>

In [12]: plt.ylabel(u'闹脾气的天数比例',fontproperties = font)

Out[12]: <matplotlib.text.Text at 0x6cadef0>

In [13]: plt.title(u'幼猫和成年猫',fontproperties = font)

Out[13]: <matplotlib.text.Text at 0x6cad5c0>

In [14]: plt.show()

　　我们的目标是训练一个感知器可以用两个解释变量分辨猫的类型。我们用阳性表示幼猫，用阴性表示成年猫。用感网络图可以呈现感知训练的过程。

　　（略）

　　（三）感知器解决文档分类

　　scikit-learn提供了感知器功能。和我们用过的其他功能类似，Perceptron类的构造器接受超参数设置。Perceptron类有fit_transform()和predict方法，Perceptro类还提供了partial_fit()方法，允许分类器训练流式数据，并作出预测

　　在下面的例子当中，我们训练一个感知器对20个新闻类别的数据集进行分类。这个数据集20个网络新闻网站收集了近2万篇新闻。这个数据集经常用来进行文档的分类和聚类实验；scikit-learn提供了下载和读取数据集的简便方法。我们将训练一个感知器识别三个新闻类别：rec.sports.hockey、rec.sport.baseball和rec.auto。scikit-learn的Perceptron也支持多类分类，使用one versus all策略为训练集中每个类型训练分类器。我们将用TF-IDF加权词袋表示新闻文档。partial_fit()方法可以连接HashingVectorizer在内存有限的情况下训练较大的流式数据

　　首先我们用fetch_20newsgroups()下载并读取数据，和其他内建数据一致，这个函数返回对象包括data,target和target_name属性。我们还去掉了每篇文章的页眉，页脚和引用文献。保留那些让分类更容易的解释变量，我们用TfidfVectorizer生成TF-IDF矢量，训练感知器，然后用测试集评估效果。

资料来源：《Machine Learning With scikit-learn》

Python_sklearn机器学习库学习笔记（七）the perceptron(感知器）的更多相关文章

Python_sklearn机器学习库学习笔记（一）_一元回归
一.引入相关库 %matplotlib inline import matplotlib.pyplot as plt from matplotlib.font_manager import FontP ...
Python_sklearn机器学习库学习笔记（一）_Feature Extraction and Preprocessing(特征提取与预处理）
# Extracting features from categorical variables #Extracting features from categorical variables 独热编 ...
Python_sklearn机器学习库学习笔记（三）logistic regression（逻辑回归）
# 逻辑回归 ## 逻辑回归处理二元分类 %matplotlib inline import matplotlib.pyplot as plt #显示中文 from matplotlib.font_m ...
Python_sklearn机器学习库学习笔记（五）k-means（聚类）
# K的选择:肘部法则如果问题中没有指定的值,可以通过肘部法则这一技术来估计聚类数量.肘部法则会把不同值的成本函数值画出来.随着值的增大,平均畸变程度会减小:每个类包含的样本数会减少,于是样本 ...
Python_sklearn机器学习库学习笔记（六） dimensionality-reduction-with-pca
# 用PCA降维 #计算协方差矩阵 import numpy as np X=[[2,0,-1.4], [2.2,0.2,-1.5], [2.4,0.1,-1], [1.9,0,-1.2]] np.c ...
Python_sklearn机器学习库学习笔记（四）decision_tree（决策树）
# 决策树 import pandas as pd from sklearn.tree import DecisionTreeClassifier from sklearn.cross_validat ...
thon_sklearn机器学习库学习笔记（四）decision_tree（决策树）
# 决策树 import pandas as pd from sklearn.tree import DecisionTreeClassifier from sklearn.cross_validat ...
python3.4学习笔记(七) 学习网站博客推荐
python3.4学习笔记(七) 学习网站博客推荐深入 Python 3http://sebug.net/paper/books/dive-into-python3/<深入 Python 3& ...
Linux学习笔记(七) 查询系统
1.查看命令 (1)man 可以使用 man 命令名称命令查看某个命令的详细用法,其显示的内容如下: NAME:命令名称 SYNOPSIS:语法 DESCRIPTION:说明 OPTIONS:选项 ...

随机推荐

mysql-5.7 持久化统计信息详解
一.持久化统计信息的意义: 统计信息用于指导mysql生成执行计划,执行计划的准确与否直接影响到SQL的执行效率:如果mysql一重启之前的统计信息就没有了,那么当SQL语句来临时,那么mysql就 ...
CentOS针对磁盘IO[jdb2进程]的优化
CentOS的jdb2进程总是沾满io,查了一些资料后才知道,这个问题源自系统bug,在此记录一下解决办法: 将高IO的磁盘,用以下参数remount即可 mount -t ext4 -o remou ...
pandas模块安装问题笔记
1. # pip install pandas 引用 pandas 时,没有模块 ,进行模块安装,出现一推英文提示结果 Collecting pandas Could not fetch URL ...
铁乐学python_Day39_多进程和multiprocess模块2
铁乐学python_Day39_多进程和multiprocess模块2 锁 -- multiprocess.Lock (进程同步) 之前我们千方百计实现了程序的异步,让多个任务可以同时在几个进程中并发 ...
JS DateTime 格式化
首先看我们在浏览器接收到的DateTime格式的数据: 如果没有在传输的时候把DateTime转成字符串的话,我们只需要在JS中加一段代码即可转换,代码如下: function ChangeDateF ...
MyISAM和innoDB对比，覆盖索引简单回顾
MyISAM Myisam是Mysql的默认存储引擎,当create创建新表时,未指定新表的存储引擎时,默认使用Myisam. 它不支持事务,也不支持外键,尤其是访问速度快,对事务完整性没有要求或者以 ...
1483. [HNOI2009]梦幻布丁【平衡树-splay】
Description N个布丁摆成一行,进行M次操作.每次将某个颜色的布丁全部变成另一种颜色的,然后再询问当前一共有多少段颜色. 例如颜色分别为1,2,2,1的四个布丁一共有3段颜色. Input ...
virtualbox+vagrant学习-2(command cli)-7-vagrant login命令
Login ⚠️该命令已经弃用了,别名为vagrant cloud auth login.看本博客的格式: vagrant cloud auth login [options] 登录命令用于使用Ha ...
创建ROS工程結構
图像化显示目录工程结构:tree $ sudo apt install tree 1.创建ROS工作空间 $ mkdir -p catkin_ws/src # Create mutil-level d ...
cmd导出oracle数据库数据
今天弄了下oracle数据库导入导出命令exp,imp 首先这个命令是在cmd直接执行,不是sqlplus登录后再执行,见下图: 再次,注意结尾不能有分号(;): exp scott/scott@su ...

Python_sklearn机器学习库学习笔记（七）the perceptron(感知器）

Python_sklearn机器学习库学习笔记（七）the perceptron(感知器）的更多相关文章

随机推荐

热门专题