机器学习之 SVM VC维度、样本数目与经验风险最小化的关系

VC维在有限的训练样本情况下，当样本数 n 固定时。此时学习机器的 VC 维越高学习机器的复杂性越高。

VC 维反映了函数集的学习能力，VC 维越大则学习机器越复杂(容量越大)。

所谓的结构风险最小化就是在保证分类精度（经验风险）的同一时候，减少学习机器的 VC 维，能够使学习机器在整个样本集上的期望风险得到控制。

经验风险和实际风险之间的关系，注意引入这个原因是什么？

由于训练误差再小也就是在这个训练集合上，实际的推广能力不行就会引起过拟合问题。

所以说要引入置信范围也就是经验误差和实际期望误差之间的关系

期望误差R(ω) ≤ Remp (ω)+ Φ（n/h）

注意Remp (ω)是经验误差也就是训练误差（线性中使得全部的都训练正确）。

Φ（n/h）是置信范围，它是和样本数和VC维有关的。

上式中置信范围Φ 随n/h添加，单调下降。

即当n/h较小时，置信范围Φ 较大，用经验风险近似实际风险就存在较大的误差。因此，用採用经验风险最小化准则。取得的最优解可能具有较差的推广性；

假设样本数较多，n/h较大。则置信范围就会非常小，採用经验风险最小化准则，求得的最优解就接近实际的最优解。

可知：影响期望风险上界的因子有两个方面：

首先是训练集的规模 n，其次是 VC 维 h。

可见，在保证分类精度（经验风险）的同一时候。减少学习机器的 VC 维，能够使学习机器在整个样本集上的期望风险得到控制，这就是结构风险最小化（Structure Risk Minimization，简称 SRM）的由来。

在有限的训练样本情况下，当样本数 n 固定时。此时学习机器的 VC 维越高(学习机器的复杂性越高)，则置信范围就越大，此时。真实风险与经验风险之间的区别就越大，这就是为什么会出现过学习现象的原因。

机器学习过程不但要使经验风险最小。还要使其 VC 维尽量小，以缩小置信范围。才干取得较小的实际风险。即对未来样本有较好的推广性，它与学习机器的 VC 维及训练样本数有关。

机器学习之 SVM VC维度、样本数目与经验风险最小化的关系的更多相关文章

svm、经验风险最小化、vc维
原文:http://blog.csdn.net/keith0812/article/details/8901113 “支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上” 结构化 ...
机器学习理论基础学习3.3--- Linear classification 线性分类之logistic regression（基于经验风险最小化）
一.逻辑回归是什么? 1.逻辑回归逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法,运用梯度下降来求解参数,来达到将数据二分类的目的. logistic回归也称为逻辑回归,与线性回归这样输出 ...
【转载】VC维，结构风险最小化
以下文章转载自http://blog.sina.com.cn/s/blog_7103b28a0102w9tr.html 如有侵权,请留言,立即删除. 1 VC维的描述和理解给定一个集合S={x1,x ...
文本分类学习（七）支持向量机SVM 的前奏结构风险最小化和VC维度理论
前言: 经历过文本的特征提取,使用LibSvm工具包进行了测试,Svm算法的效果还是很好的.于是开始逐一的去了解SVM的原理. SVM 是在建立在结构风险最小化和VC维理论的基础上.所以这篇只介绍关于 ...
《机器学习基石》---VC维
1 VC维的定义 VC维其实就是第一个break point的之前的样本容量.标准定义是:对一个假设空间,如果存在N个样本能够被假设空间中的h按所有可能的2的N次方种形式分开,则称该假设空间能够把N个 ...
项目二：使用机器学习（SVM）进行基因预测
SVM软件包 LIBSVM -- A Library for Support Vector Machines(本项目所用到的SVM包)(目前最新版:libsvm-3.21,2016年7月8日) C-S ...
机器学习——支持向量机SVM
前言学习本章节前需要先学习: <机器学习--最优化问题:拉格朗日乘子法.KKT条件以及对偶问题> <机器学习--感知机> 1 摘要: 支持向量机(SVM)是一种二类分类模型, ...
【机器学习】svm
机器学习算法--SVM 目录机器学习算法--SVM 1. 背景 2. SVM推导 2.1 几何间隔和函数间隔 2.2 SVM原问题 2.3 SVM对偶问题 2.4 SMO算法 2.4.1 更新公式 ...
机器学习：SVM（目标函数推导：Hard Margin SVM、Soft Margin SVM）
一.Hard Margin SVM SVM 的思想,最终用数学表达出来,就是在优化一个有条件的目标函数: 此为 Hard Margin SVM,一切的前提都是样本类型线性可分: 1)思想 SVM 算法 ...

随机推荐

Axure 地区选择（选择省份之后可以选择对应的地级市）
百度网盘:http://pan.baidu.com/s/1c1ZjUPq
codevs 1862 最长公共子序列（求最长公共子序列长度并统计最长公共子序列的个数）
题目描述 Description 字符序列的子序列是指从给定字符序列中随意地(不一定连续)去掉若干个字符(可能一个也不去掉)后所形成的字符序列.令给定的字符序列X=“x0,x1,…,xm-1”,序列Y ...
Android实现中文汉字笔划(笔画)、中文拼音排序、英文排序
发布时间:2018-11-16 技术:Android 概述最近要做一个类似微信的,在登录界面选择国家地区的功能,微信有中文汉字笔画排序以及中文拼音排序等几种方式,如下所示: 简体中文拼音排 ...
使用maven编译Java项目
摘要: 综述本文演示了用Maven编译Java项目需要时间:15分钟文本编辑器或者IDE JDK 6 或者更高版本创建项目本例主要为了展示Maven,所以Java的项目力求简单. 创建项目 ...
Easyui + asp.net MVC 系列教程第19-23 节完成注销登录限制过滤添加用户
前面视频文章地址 Easyui + asp.net MVC 系列教程第09-17 节完成登录高清录制 Easyui + asp.net mvc + sqlite 开发教程(录屏)适合入门 ...
Emacs中Golang的设置
欲善其事,先利其器.下面记录一些使用Emacs24做golang开发中的一些有用设置,备忘用. 一,golang中的代码跳转 emacs24的go-mode中默认用godef-describe,god ...
iOS刻度尺换算之1mm等于多少像素理解
刚好看到一个刻度尺文章,实现手机屏幕上画刻度尺. 然后就有一个疑问:这个现实中的1mm(1毫米)长度与手机像素之间的换算比怎么来的呢? 看了下demo代码,发现这样写的: CGFloat sc_w = ...
numpy中的argpartition
numpy.argpartition(a, kth, axis=-1, kind='introselect', order=None) 在快排算法中,有一个典型的操作:partition.这个操作指: ...
【总结】550,535,553 Mail from must equal authorized user— jenkins(hudson) email163邮箱和26邮箱成功配置总结
Failed to send out e-mail com.sun.mail.smtp.SMTPSendFailedException: 553 Mail from must equal author ...
linux shell 脚本攻略学习10--生成任意大小的文件和文本文件的交集与差集详解
一.生成任意大小的文件(dd命令): 举例: amosli@amosli-pc:~/learn/example$ ; + records in + records out bytes ( MB/s a ...

机器学习 之 SVM VC维度、样本数目与经验风险最小化的关系

机器学习 之 SVM VC维度、样本数目与经验风险最小化的关系的更多相关文章

随机推荐

热门专题

机器学习之 SVM VC维度、样本数目与经验风险最小化的关系

机器学习之 SVM VC维度、样本数目与经验风险最小化的关系的更多相关文章