【Machine Learning】监督学习、非监督学习及强化学习对比

Supervised Learning
Unsupervised Learning
Reinforced Learning

Goal：

How to apply these methods
How to evaluate each methods

What is Machine Learning?

1.computational statistics
2.computational artifacts(人工制品) that learn over time based on experience

一、分类

Supervised Learning
Unsupervised Learning
Reinforcement Learning

1.1 Supervised learning——Approximation

一句话实质：About Function Approximation(函数逼近)，or Approximate function induction(近似函数归纳)
feed with labeled examples，comeing up with some function that generalizes beyond(泛化函数)
有反馈

1.2 Unsupervised learning——Description

一句话实质：About Compact(简洁的) Description
无监督学习是密切相关的统计数据密度估计的问题。
无反馈
Unsupervised learning could be helpful in the supervised Setting

1.3 Reinforcement learning (增强学习)

一句话实质：Learning from delayed reward (通过延迟性奖励进行学习)
执行许多步之后才知道反馈，就像下棋（对比监督学习的立即反馈）

二、归纳法(induction)与演绎法(deduction)

Generalize 泛化
了解机器学习发展史
机器学习算法与归纳而不是演绎有关
Inductive bias 归纳偏差

归纳：从示例到一般规律（从一个示例得出更普遍的规律）

演绎：从规则到实例，a general rule to specific instances,basically like reasoning(推理)

三、三种机器学习的比较

表述成：优化问题

Supervised Learning —— labels data well(to find a funtion to score that) （标记数据）
Unsupervised Learning —— cluster scores well(最好的分类方法)
Reinforcement learning —— behavior scores well (最好的表现)

3.2 Data

Data is king in machine learning.

转变：以算法为中心——》以数据为中心

Believe in your data！

【Machine Learning】监督学习、非监督学习及强化学习对比的更多相关文章

131.005 Unsupervised Learning - Cluster | 非监督学习 - 聚类
@(131 - Machine Learning | 机器学习) 零. Goal How Unsupervised Learning fills in that model gap from the ...
Machine Learning 之二，什么监督性学习，非监督性学习。
1.什么是监督性学习?Supervised Machine Learning. 在监督性学习,我们给定一个数据集以及我们已经知道正确输出的结果,然后找到一个输入和输出的关系. In Supervis ...
如何区分监督学习(supervised learning)和非监督学习(unsupervised learning)
监督学习:简单来说就是给定一定的训练样本(这里一定要注意,样本是既有数据,也有数据对应的结果),利用这个样本进行训练得到一个模型(可以说是一个函数),然后利用这个模型,将所有的输入映射为相应的输出,之 ...
Reinforcement Learning 的那点事——强化学习（一）
引言最近实验室的项目需要用到强化学习的有关内容,就开始学习起强化学习了,这里准备将学习的一些内容记录下来,作为笔记,方便日后忘记了好再方便熟悉,也可供大家参考.该篇为强化学习开篇文章,主要概括一些有 ...
监督学习&非监督学习
监督学习 1 - 3 - Supervised Learning 在监督学习中,数据集中的每个例子,算法将预测得到例子的""正确答案"",像房子的价格,或者溜 ...
机器学习之强化学习概览（Machine Learning for Humans: Reinforcement Learning）
声明:本文翻译自Vishal Maini在Medium平台上发布的<Machine Learning for Humans>的教程的<Part 5: Reinforcement Le ...
【资料总结】| Deep Reinforcement Learning 深度强化学习
在机器学习中,我们经常会分类为有监督学习和无监督学习,但是尝尝会忽略一个重要的分支,强化学习.有监督学习和无监督学习非常好去区分,学习的目标,有无标签等都是区分标准.如果说监督学习的目标是预测,那么强 ...
强化学习(Reinforcement Learning)中的Q-Learning、DQN，面试看这篇就够了！
1. 什么是强化学习其他许多机器学习算法中学习器都是学得怎样做,而强化学习(Reinforcement Learning, RL)是在尝试的过程中学习到在特定的情境下选择哪种行动可以得到最大的回报. ...
k-means 非监督学习聚类算法
非监督学习非监督学习没有历史样本数据和标签,直接对数据分析或得结果. k-means 使用 >>> from sklearn.cluster import KMeans >& ...

随机推荐

python全栈开发_day4_if，while和for
一.if 1)if的用途 if常用于判断. 2)if的语法 tag=True tag2=True if tag: print("代码") elif tag2: print(&quo ...
128th LeetCode Weekly Contest Complement of Base 10 Integer
Every non-negative integer N has a binary representation. For example, 5 can be represented as &quo ...
常用sql记录
一.修改字段默认值 alter table 表名 drop constraint 约束名字 ------说明:删除表的字段的原有约束 alter table 表名 add constraint 约 ...
关于浏览器localhost点击wamp项目跳转出错
www目录下index.php399行代码 $handle=opendir("."); $projectContents = ''; while (($file = readdir ...
element-ui table多选CheckBox参数解析
element-UI里的table表格与多选框CheckBox的组合很常用,官网也给了很多参数,自己总结了一下,方便日后使用 1.简易用法,没有附加的功能要在表格里使用CheckBox很简单,只需设 ...
Robot Framework的安装、更新与卸载
Robot Framework的安装.更新与卸载一,安装RF前的准备一般就三种执行环境 Python, Jython (JVM) 和 IronPython (.NET): 安装python: #T ...
1 复习ha相关 + weekend110的hive的元数据库mysql方式安装配置（完全正确配法）（CentOS版本）（包含卸载系统自带的MySQL）
本博文的主要内容是: .复习HA相关 .MySQL数据库 .先在MySQL数据库中建立hive数据库 .hive的配置以下是Apache Hadoop HA的总结.分为hdfs HA和yarn HA ...
Python获取当前路径下的配置文件
Python获取当前路径下的配置文件有的时候想读取当前目录下的一个配置文件.其采用的办法是: import os # 获取当前路径 curr_dir = os.path.dirname(os.pat ...
JVM的内存结构
程序计数器程序计数器(Program Counter Register)是一块较小的内存空间,它可以看作是当前线程所执行的字节码的行号指示器.字节码解释器工作时就是通过改变这个计数器的值来选取下一条 ...
list-iscroll5.2
简介 iScroll是一个高性能,资源占用少,无依赖,多平台的JavaScript滚动插件. 它可以在桌面,移动设备和智能电视平台上工作.它一直在大力优化性能和文件大小以便在新旧设备上提供最顺畅的体验 ...