机器学习技法总结（四）（aggregation，vote，bootstrap...）

研究的动机是：我们采用了不同的模型得到T个不同的g，那么我们是不是可以通过这些不同的g的融合得到更加出色的G呢？因此，便有了以上四种不同的方法；1）（select）直接选择最好的一个作为融合的结果；2）（uniform）所有的g公平vote；3）（non-uniform）相当于你比较相信某个结果，就赋予它较高的vote权重，这种类似于二次回归问题，就是说，先对不同模型进行优化得到不同的g，然后再次优化做出回归；4）很简单的predictions conditionally。前面的都可以看作是后面的特例。

上图解释了通过aggregation，通过均匀的弱的hypothesis的mix，我们可以实现比较弯弯曲曲的分界线，这是不是实现了特征转换，使得Ein比较小？另外，这样多次的mix，可能使得PLA取得比较靠中间的那个hypothesis，这样是不是就类似了svm中的large margin的效果，这样aggregation就类似于能够较好的实现特征转换和正则化。

在设计融合的时候，要注意一点，如果我们直接从Ein中选择最小的作为目标的话，这就像是扩大了Hypothesis set的大小，那么VC dimension则变大了，很容易出现overfitting，因此，最好的办法还是通过validation来赛选g-，然后再回传g进行融合。如下图所示：

下面如何得到不同的g呢？主要有以下几种：不同模型，不同的参数，不同的数据等...

借助统计中的一个bootstrap可以实现对data的重新采样，得到了一下的方法：

林老师讲了一个利用PLA作为算法，然后借助bootstrap-aggregation得到了如下的效果：

从图中的效果可以看出，其实效果还不错。

主要关注两个方向：一个是g的diversity，二是democracy。

机器学习技法总结（四）（aggregation，vote，bootstrap...）的更多相关文章

机器学习技法课之Aggregation模型
Courses上台湾大学林轩田老师的机器学习技法课之Aggregation 模型学习笔记. 混合(blending) 本笔记是Course上台湾大学林轩田老师的<机器学习技法课>的学习笔记 ...
机器学习技法之Aggregation方法总结：Blending、Learning（Bagging、AdaBoost、Decision Tree）及其aggregation of aggregation
本文主要基于台大林轩田老师的机器学习技法课程中关于使用融合(aggregation)方法获得更好性能的g的一个总结.包含从静态的融合方法blending(已经有了一堆的g,通过uniform:voti ...
机器学习技法笔记(2)-Linear SVM
从这一节开始学习机器学习技法课程中的SVM, 这一节主要介绍标准形式的SVM: Linear SVM 引入SVM 首先回顾Percentron Learning Algrithm(感知器算法PLA)是 ...
Coursera台大机器学习技法课程笔记01-linear hard SVM
极其淡腾的一学期终于过去了,暑假打算学下台大的这门机器学习技法. 第一课是对SVM的介绍,虽然之前也学过,但听了一次感觉还是很有收获的.这位博主总结了个大概,具体细节还是要听课:http://www ...
python机器学习实战（四）
python机器学习实战(三) 版权声明:本文为博主原创文章,转载请指明转载地址 www.cnblogs.com/fydeblog/p/7364317.html 前言这篇notebook是关于机器学 ...
《机器学习技法》---线性SVM
(本文内容和图片来自林轩田老师<机器学习技法>) 1. 线性SVM的推导 1.1 形象理解为什么要使用间隔最大化容忍更多的测量误差,更加的robust.间隔越大,噪声容忍度越大: 1.2 ...
《机器学习技法》---核型SVM
(本文内容和图片来自林轩田老师<机器学习技法>) 1. 核技巧引入如果要用SVM来做非线性的分类,我们采用的方法是将原来的特征空间映射到另一个更高维的空间,在这个更高维的空间做线性的SV ...
机器学习技法总结（五）Adaptive Boosting, AdaBoost-Stump,决策树
上一讲主要利用不同模型计算出来的g.採用aggregation来实现更好的g.假设还没有做出来g.我们能够採用bootstrap的方法来做出一系列的"diversity"的data ...
机器学习技法实现（一）：AdaBoost- Decision Stump （AdaBoost - 决策树的基于Matlab的实现）
经过前面对AdaBoost的总结,下面要基于Matlab实现AdaBoost-Stump进行二维平面数据点的分类的实验. 一. 实验原理参看 http://blog.csdn.net/lg12591 ...

随机推荐

【转】TUN/TAP虚拟网络设备
转: 原文:https://www.cnblogs.com/wyzhou/p/9286864.html ------------------------------------------------ ...
项目（一）--python3--爬虫实战
最近看了python3网络爬虫开发实战一书,内容全面,但不够深入:是入门的好书. 作者的gitbook电子版(缺少最后几章) python3网络爬虫实战完整版PDF(如百度网盘链接被屏蔽请联系我更新) ...
intellij高亮字体背景颜色
https://blog.csdn.net/aosica321/article/details/52956419 https://blog.csdn.net/lxzpp/article/details ...
python 格式化输出%s %f %d
格式说明由%和格式字符组成,如%f,它的作用是将数据按照指定的格式输出.格式说明是由“%”字符开始的. 1.整型输出%d print 'my age is %d'% (26) 说明:%d相当于是一个占 ...
python - 对接微信支付（PC）和注意点
注:本文仅提供 pc 端微信扫码支付(模式一)的示例代码. 关于对接过程中遇到的问题总结在本文最下方. 参考: 官方文档, https://blog.csdn.net/lm_is_dc/arti ...
3.Vue 实例
创建一个 Vue 实例每个 Vue 应用都是通过用 Vue 函数创建一个新的 Vue 实例开始的: var vm = new Vue({ // 选项 }) 虽然没有完全遵循 MVVM 模型,但是 V ...
docker容器配置加速器
1.编辑docker配置文件 vi /etc/docker/daemon.json 加入如下配置: {"registry-mirrors":["https://docke ...
UDP网络程序设计
udp_server #include<stdio.h>#include<sys/socket.h>#include<string.h>#include<ne ...
解决WordPress访问中文标签出现404的几个方法
最近很多主题用户提到安装完WordPress后中文标签出现404的情况,出现这种情况一般修改固定链接设置是没有效果的,多数是windows主机带来的麻烦.网上多数人说要修改核心文件class-wp.p ...
2019 SDN第3次上机作业
0.报文类型与含义 1.Controller-to-Switch 报文 Cortoller-to-Switch是由控制器初始化并下发给交换机的报文类型,其可能会要求交换机回复对应的报文,此类型报文 ...

机器学习技法总结（四）（aggregation，vote，bootstrap...）

机器学习技法总结（四）（aggregation，vote，bootstrap...）的更多相关文章

随机推荐

热门专题