机器学习真的可以起作用吗？（2）（以二维PLA算法为例）

2024-08-30 14:04:00 原文

一个问题：大多数情况下，M（hypothesis set的大小）是无穷大的，例如PLA算法。那么是不是我们的原则1就不能使用了？

我们试着做一些努力：

Step1：寻找hypothesis set的effective number来代替M

什么意思呢？就是之前推导中，但是呢，例如在PLA算法中，h1和h2是如此的相像（考虑平面上的直线），所以，如果D对于h1是GOOD，那么对于h2也是GOOD。即：重叠部分太多，我们over-estimatinng了。

现在我们换一种思路。从DataSet的角度看问题。

什么意思？对于只有一个点的D，所有的h分为两类：一种是把x1分为的，一种是分为 ×。

到现在，我们已经明白这种思路了。对于对于每一个h，我们看它对于D中每一个数据的分类情况。这叫做一个dichotomy。那么H的effective Number 就是dichotomies的总数。

但是呢，这样的话，我们的计算过程又依赖于D的具体数据，所以使用Growth Function来移除对数据的依赖：即我们使用|H(x1; x2; : : : ; xN)|的上限。用来表示：

如果Growth Function是polynomial 而非exponential，那么我们就可以使用原则1设计学习算法A。

Step2：effective number是Polynomial 而非exponential

根据上文，我们知道，只需要证明effective number是Polynomial 而非exponential，我们就大功告成了。但是，我们需要引入几个概念来辅助我们的证明过程

概念：Break Point & shatter

这是对于解决Growth Function问题很重要的两个概念。

存在2个输入点，PLA的H可以完全实现四种分类。这时，称这2个点被shatter。

存在3个输入点，PLA的H可以完全实现8种分类，这时，称这3个点被shatter。

但是，没有任何4个点，可以被PLA的H shatter。

此时，4就是H的break point。

设k是H的break point，则有 ，下面是证明过程。正常巧妙。

定义bounding function：

则有：

如何求解其余的B(N,k)？

以B(4,3)为例，看看能不能用B(3,?)解决。

B(4,3)=11，可以分成两类：一类是x4成对出现的，一类是x4成单出现的。

因为k=3，所以任意3点都不能shatter，即：α+β≤B(3,3)。

又因为对于2α来说，x4是成对出现的，所以，x1，x2，x3任意两个点必然不能shatter，否则的话，再加上x4，就会有三个点被shatter。即：α≤B(3,2)。

可用数学归纳法证明。此时不等式右端为growth function上限的上限。（可以证明，上面的≤实际上是=）

机器学习真的可以起作用吗？（2）（以二维PLA算法为例）的更多相关文章

机器学习真的可以起作用吗？（3）（以二维PLA为例）
前两篇文章已经完成了大部分的工作,这篇文章主要是讲VC bound和 VC dimension这两个概念. (一)前文的一点补充根据前面的讨论,我们似乎只需要用来替代来源的M就可以了,但是实际公式却 ...
paper 127：机器学习中的范数规则化之（二）核范数与规则项参数选择
机器学习中的范数规则化之(二)核范数与规则项参数选择 zouxy09@qq.com http://blog.csdn.net/zouxy09 上一篇博文,我们聊到了L0,L1和L2范数,这篇我们絮叨絮 ...
[机器学习]-[数据预处理]-中心化缩放 KNN（二）
上次我们使用精度评估得到的成绩是 61%,成绩并不理想,再使 recall 和 f1 看下成绩如何? 首先我们先了解一下召回率和 f1. 真实结果预测结果预测结果正例反例正例 TP 真 ...
R语言︱机器学习模型评估方案（以随机森林算法为例）
笔者寄语:本文中大多内容来自<数据挖掘之道>,本文为读书笔记.在刚刚接触机器学习的时候,觉得在监督学习之后,做一个混淆矩阵就已经足够,但是完整的机器学习解决方案并不会如此草率.需要完整的评 ...
[转]Python3《机器学习实战》学习笔记（一）：k-近邻算法(史诗级干货长文)
转自http://blog.csdn.net/c406495762/article/details/75172850 版权声明:本文为博主原创文章,未经博主允许不得转载. 目录(?)[-] 一简 ...
学机器学习，不会数据处理怎么行？—— 二、Pandas详解
在上篇文章学机器学习,不会数据处理怎么行?—— 一.NumPy详解中,介绍了NumPy的一些基本内容,以及使用方法,在这篇文章中,将接着介绍另一模块——Pandas.(本文所用代码在这里) Panda ...
机器学习：PCA（高维数据映射为低维数据封装&调用）
一.基础理解 1) PCA 降维的基本原理寻找另外一个坐标系,新坐标系中的坐标轴以此表示原来样本的重要程度,也就是主成分:取出前 k 个主成分,将数据映射到这 k 个坐标轴上,获得一个低维的数据集. ...
机器学习在IC设计中的应用（二）--根据GBA时序结果来预测PBA
本文转自:自己的微信公众号<集成电路设计及EDA教程> <机器学习在IC设计中的应用(二)--根据GBA时序结果来预测PBA> AOCV AOCV全称:Advanced OCV ...
【Python机器学习实战】决策树和集成学习（二）——决策树的实现
摘要:上一节对决策树的基本原理进行了梳理,本节主要根据其原理做一个逻辑的实现,然后调用sklearn的包实现决策树分类. 这里主要是对分类树的决策进行实现,算法采用ID3,即以信息增益作为划分标准进行 ...

随机推荐

spring利用注解来注册bean到容器
1.spring利用注解来定义bean,或者利用注解来注册装配bean.包括注册到ioc中,装配包括成员变量的自动注入. 1.spring会自动扫描所有类的注解,扫描这些注解后,spring会将这些b ...
IT讲师韩顺平：我为什么辞去百万年薪，自己创业？
先自我介绍一下,我叫韩顺平,是一名IT讲师.国内很多自学PHP和Java的朋友都看过我的视频课程,算是有些知名度. 15年8月从传智辞职后,很多朋友非常关心我的去向,网上也流传各种说法,有的说我和某某 ...
Xamarin.Android 入门之：Android的生命周期
一.前言活动是Android应用程序的基本构建块,他们可以在许多不同的状态存在.当你把一个Android程序置于后台,过一段时间再打开发现之前的数据还存在. 二.活动状态下面的图表说明了一个活动可 ...
前端必杀技之Javascript 第1天
学习了javascript基本语法和使用DOM进行简单操作 1.引用javascript方法: a.在<script></script>标签中加入js代码,如: <s ...
NSArray 利用数组创建数组
NSArray *array=[NSArray arrayWithObjects:@"1",@"2",@"3", nil]; ...
PHP Warning: date(): It is not safe to rely on the system's timezone settings.
OSSEC安装结束后运行,运行以下命令却抛错 cat /opt/ossec/logs/alerts/alerts.log 具体抛错内容: ** Alert 1468897672.2164786: ma ...
Android Andbase应用开发框架
[运行说明]运行AndbaseDemo需要将文件中的Andbase库Add进demo中.1.andbase中包含了大量的开发常用手段.如网络下载,多线程与线程池的管理,数据库ORM,图片缓存管理,图片 ...
android下activity中多个listview只允许主界面滚动
之前发现了自己的APP在处理两个listview时产生的一个bug.当两个listview中的item数量多出手机屏幕时,listview不能显示完全.一开始觉得只要加一个scrollview就可以了 ...
Spring学习8-Spring事务管理
http://blog.sina.com.cn/s/blog_7ffb8dd501014e0f.html Spring学习8-Spring事务管理(注解式声明事务管理) 标签: spring注 ...
velocity加减运算注意格式 ,加减号的左右都要有空格
velocity加减运算注意格式 ,加减号的左右都要有空格 #set( $left= $!biz.value - $vMUtils.getReturnMoney($!biz.billBuy) )