第一章 绪论

1.1引言

打开书,五分钟后,合上书:嗯!学会了!如何判断一个好瓜

1.2基本术语

分类:对离散值进行预测的学习任务,是有监督学习的代表

回归:对连续值进行预测的学习任务,是有监督学习的代表

聚类:将训练集中的样本分成若干组,是无监督学习的代表

泛化能力:学得模型适用于新样本的能力

1.3假设空间

假设空间:与训练集匹配的假设所组成的空间

版本空间:与训练集一致的假设集合

  有关于假设空间的疑惑:

    若“色泽”“根蒂”“敲声”分别有3、3、3种可能取值,则我们面临的假设空间规模大小为4×4×4+1=65

  尝试解释:

    首先就是这个“4”应该看作是3+1,其中这个+1表示的是在这个选项下任何情况均满足好瓜的假设(即通配),其次就是最后的+1表示的应该就是世界上不存在“好瓜”这一假设。

习题:

1.1 表1.1中若只包含编号为1和4的两个样例,试给出相应的版本空间。

编号 色泽 根蒂 敲声 好瓜
1 青绿 蜷缩 浊响
4 乌黑 稍蜷 沉闷

解答:

1.3 若数据包含噪声,则假设空间中有可能不存在与所有训练样本都一致的假设。在此情形下,设计一种归纳偏好用于假设选择。

分析:既然数据中包含噪声,最直接的思路就是首先去除噪声。

   去噪方法:若存在两个样例属性取值都相同,标记却不同,则只保留标记为正例的样例(或标记为反例的样例,也可以考虑更加复杂的统计相似样例),在此基础上求出版本空间。

   也可以考虑其他方法:

    >1.在求版本空间时,只除去与反例不一致的假设。

    >2.求版本空间时,只留下包含了所有正例的假设。

第二章 模型评估与选择

2.1 经验误差与过拟合

错误率:分类错误的样本数找样本总数的比例;

经验误差:学习器在训练集上的误差;

泛化误差:学习器在新样本上的误差;

过拟合:学习器将训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质,这样导致了泛化性能下降。

欠拟合:对训练样本的一般性质尚未学习好,容易克服,如在决策树学习中扩展分支,在神经网络学习中增加训练轮数等。

2.2 评估方法

  将数据集划分为训练集和测试集的方法

2.2.1 留出法

  直接将数据集D划分为两个互斥的集合,其中一个集合作为训练集S,另一个作为测试集T

在划分时要注意在分类任务重至少保持样本的类别比例相似!
单次使用留出法得到的估计结果往往不够稳定可靠,一般要采用若干次随机划分、重复进行实验评估后取平均值作为留出法的评估结果。
常见做法是将大约2/3~4/5的样本用于训练,剩余样本用于测试。

2.2.2 交叉验证法

  依据分层采样的方法先将数据集划分为k个大小相似的互斥子集,每个子集尽可能保持数据分布的一致性,然后每次用(k-1)个子集的并集作为训练集,余下的那个子集作为测试机,这样就可以获得k组训练/测试集,从而可进行k次训练和测试,最终返回的是k个测试结果的平均值,k常取10,也称10折交叉验证。

  与留出法相似,将数据集D划分为k个子集同样存在多种划分方式,为了减小因样本划分不同而引入的差别,k折交叉验证通常要随即使用不同的划分重复p次,最终的评估结果是这p次k折交叉验证结果的均值,例如常见的**“10次10折交叉验证”**

留一法:每个子集中仅含一个样本,这使得评估结果比较精确,而当数据集比较大时,其计算开销《难以忍受》。

2.2.3 自助法

当前已知缺陷:

留出法与交叉验证法:实际评估的模型所使用的训练集比D小,这必然将引入一些因训练样本规模不同而导致的估计偏差

留一法:计算复杂度过高

  若给定包含m个样本的数据集D,我们对它进行采样产生数据集D':每次随机从D中挑选一个样本,将其拷贝放入D',然后再将该样本放回初始数据集D中,使得该样本在下次采样时仍有可能被采到;这个过程重复执行m次后,我们就可以得到包含M个样本的数据集D',做一个估计。样本在m次采样中始终不被采到的概率是\((1-\frac{1}{m})^m\),取极限得到:

$\lim_{m\rightarrow+\infty} (1-\frac{1}{m})^m=\frac{1}{e}≈0.368$
即通过自主采样,初始数据集D中约有36.8%的样本未出现在采样数据集D'中于是我们可将D'用作训练集,D\D'用作测试集;这样,实际评估的模型与期望评估的模型都使用m个训练样本,而我们仍有约$\frac{1}{3}$的、没在训练集中出现的样本用于测试,这样的测试结果,亦称“包外估计”。

自助法在数据集较小,难以划分有限训练/测试集时很有用。

2.2.4 调参与最终模型

在模型选择完成后,学习算法和参数配置已选定,此时应该用数据集D重新训练模型,这个模型在训练过程中使用了所有m个样本,这才是我们最终提交给用户的模型。

2.3 性能度量

在预测任务中,给定样例集\(D={(x_1,y_1)(x_2,y_2)...(x_m,y_m)}\),其中y_i是示例x_i的真实标记,要评估学习器\(\mathcal{f}\)的性能,就要把学习器预测结果\(\mathcal{f(x)}\)与真实标记\(\mathcal{y}\)进行比较。

2.3.1 错误率与精度

2.3.2 查准率、查全率与F1

真实情况 预测正例 预测反例
正例 TP(真正例) FN(假反例)
反例 FP(假正例) TN(真反例)
则查重率P和查全率R分别定义为:

$\mathcal{P=\frac{TP}{TP+FP}}$
$\mathcal{R=\frac{TP}{TP+FN}}$

查重率与查全率也在一定程度上遵循测不准原理,通常只有在一些简单任务中,才能使查全率和查重率都很高。

P-R曲线中的内容:覆盖更大范围的学习器的性能更优

对查重率与查全率进行取舍的方式:

BEP:查重率=查全率时的取值,值大者性能更优;

F1度量:(公式不想打上来了)以beta参数来衡量查全率对查重率的相对重要性。

家人们,晚安( ̄o ̄) . z Z

Datawhale组队学习_Task01:概览西瓜书+南瓜书第1、2章的更多相关文章

  1. Directx11学习笔记【八】 龙书D3DApp的实现

    原文:Directx11学习笔记[八] 龙书D3DApp的实现 directx11龙书中的初始化程序D3DApp跟我们上次写的初始化程序大体一致,只是包含了计时器的内容,而且使用了深度模板缓冲. D3 ...

  2. JAVA学习之Ecplise IDE 使用技巧(2)第二章:键盘小快手,代码辅助

    上一篇:JAVA学习之Ecplise IDE 使用技巧(1)第一章:我的地盘我做主,工作空间 第二章:键盘小快手,代码辅助 内容包括: 第一:显示行号 如何设置行号:Ecplice菜单Windows& ...

  3. noj 2033 一页书的书 [ dp + 组合数 ]

    传送门 一页书的书 时间限制(普通/Java) : 1000 MS/ 3000 MS          运行内存限制 : 65536 KByte总提交 : 53            测试通过 : 1 ...

  4. 每周一荐:学习ACE一定要看的书

    作 者:david++发布时间:2012/06/08 09:02文章地址:http://game-lab.org/?p=320 近两个月都在学习ACE,一个超级强大,也超级复杂的网络框架库.对ACE的 ...

  5. 推荐一些关于学习Html Css和Js的书吗?

    前端易学易懂,随着移动互联网的日益兴起,it行业对于前端的需求也在不断的提高,那么从前端小白修炼成为前端大神的这个过程之中,一些必备的枕边书也是必不可少的. 第一本,入门<Head first ...

  6. 学习MVC和jQuery相关的书

    Insus.NET还是较喜欢看纸质书.学习ASP.NET MVC和jQuery编程,Insus.NET为了加强功力,决定再购买几本相关的书:   十月份时,还买了一本: 前两本快递刚送到手,后一本已经 ...

  7. Egret入门学习日记 --- 第十三篇(书中 5.2~5.3节 内容)

    第十三篇(书中 5.2~5.3节 内容) 写日记已经十天多了,我发现越到后面,我书写的方式越来越程序化. 感觉渐渐失去了人类所谓的感情似的. 不过,没想到的是,书中的内容,很少出现了错误,我一路过来到 ...

  8. Egret入门学习日记 --- 第十一篇(书中 4.1~4.6节 内容)

    第十一篇(书中 4.1~4.6节 内容) 好了,到了这篇开始,前三章都记录完了. 接下来就是到第四章了. 4.1节 的内容总结一下重点: 1.resource目录下default.res.json文件 ...

  9. 十步学习法 -- 来自<<软技能>>一书的学习方法论

    <<软技能>>第三篇“学习”,作者讲述了自己的学习方法:十步学习法.下面我用编程语言的方式来介绍. 十步学习法 伪代码介绍 # **这一步的目的不是要掌握整个主题,而是对相关内 ...

  10. Egret入门学习日记 --- 第五篇(书中 3.5节 内容)

    第五篇(书中 3.5节 内容) 今天得把昨天的问题解决了才行. 去了Q群,碰到一位大大,他给我解惑了.Thanks♪(・ω・)ノ 这是我之前按照书上写的方式写的,并没有效果. 然后大大给我解答了: 后 ...

随机推荐

  1. dotnet7 aot编译实战

    0 起因 这段日子看到dotnet7-rc1发布,我对NativeAot功能比较感兴趣,如果aot成功,这意味了我们的dotnet程序在防破解的上直接指数级提高.我随手使用asp.netcore-7. ...

  2. KubePi主界面添加镜像仓库并授权给集群,供创建Deployment时选择镜像使用

    1.添加kubeoperator自带的nexus仓库 2.添加harbor 3.把添加的镜像仓库授权给集群 4.关于镜像仓库secrets的有关说明 5.实际效果 6.从添加授权的镜像仓库创建工作负载 ...

  3. MySQL5.6 & 5.7 配置 SSL

    mysql5.7上开启并配置ssl [root@mysqlmaster01 bin]# ./mysql_ssl_rsa_setup --datadir=/data/mysql_data1/ --use ...

  4. 胎压监测系统(DWS)

    胎压监测系统(DWS)通过监测和比较行驶时各车轮和轮胎的滚动半径和旋转特性,以确定是否一个或多个轮胎明显充气不足,而非直接测量各轮胎的压力. 系统监测到异常时指示灯将点亮,且仪表上出现信息. 必须校准 ...

  5. Elasticsearch启动https访问

    Elasticsearch上操作 前提:已设置密码访问 ./bin/elasticsearch-certutil ca # 生成elastic-stack-ca.p12文件 ./bin/elastic ...

  6. MySQL 自增字段取值

    1 前言 本文来自回答思否网友的一个问题,这个网友新建了一张表,auto_increment_increment设为10,AUTO_INCREMENT主键起始值设为9, 当他插入数据的时候,发现主键值 ...

  7. 《Go 精进之路》 读书笔记 (第一次更新)

    <Go 精进之路> 读书笔记.简要记录自己打五角星的部分,方便复习巩固.目前看到p120 Go 语言遵从的设计哲学为组合 垂直组合:类型嵌入,快速让一个类型复用其他类型已经实现的能力,实现 ...

  8. 整理一些Windows桌面运维常用的命令,并且整合成脚本

    github地址:alittlemc/toy: 编写些脚本将运维经常所用到小玩意所集成在一起 (github.com) 持续更新! 前言 做过桌面运维的大佬们应该可以很明显感受到这份工作所需要的技能不 ...

  9. Go的网络编程详解

    一 互联网协议介绍 1.1互联网分层模型 互联网的逻辑实现被分为好几层.每一层都有自己的功能,就像建筑物一样,每一层都靠下一层支持.用户接触到的只是最上面的那一层,根本不会感觉到下面的几层.要理解互联 ...

  10. 分支结构之二:switch-case

    1.格式 switch(表达式){case 常量1: 执行语句1; //break; case 常量2: 执行语句2; //break; ... default: 执行语句n; //break; } ...