Machine Learning的定义
---恢复内容开始---
所下内容都是对吴恩达教授的机器学习所做的笔记
下面是Arthur Samue对机器学习的定义
在没有明确设置的情况下,是计算机具有学习能力的研究领域。
这是一个比较陈旧一点的定义。
下面是Tom Mitchell的定义
计算机程序从经验(E)中学习,解决某一任务(T)进行某一性能度量(P),通过P测定在T上的表现因经验E而提高。
主要两种学习算法:1.监督学习 2. 无监督学习
简单来说监督学习就是我们会教计算机做某件事,然而在无监督学习中,是我们让计算机自己学习。
Supervised Learning (监督学习)
例子:
一个学生收集了这些数据,假设你绘制了一个数据集就像上图这样,横轴是不同房屋的平方英尺数,纵轴是不同房子的价格 单位是千美元,交涉你的朋友右一栋750平方英尺的房子,他想知道能卖多少钱, 然而学习算法能干吗呢?学习算法能做到的一件事就是根据数据画一条直线或者说用一条直线拟合数据,从而估计房子可以卖大约15万美元。
监督学习是指我们给算法一个数据集,其中包含了正确答案,也就是说我们给它一个房价数据集,在这个数据集中的每个样本,我们都给出正确的价格,即这个房子实际卖价,算法的母的就是给出更多的正确答案,例如为你朋友想要卖掉的这所新房子给出估价 ,用更专业的术语来定义称为回归问题,我们想要预测连续的数值输出价格。价格实际上是一个离散值。我们设法预测连续值的属性
例子:下面这一行是良性肿瘤, 上面这一行是恶性肿瘤,假设我们有个朋友不幸患了乳腺肿瘤, 它的大小可能是这个值 (紫色标记) 附近,机器学习的问题就是,你能否估计出肿瘤是良性还是恶性的概率,用更专业的术语讲这就是一个分类问题,分类是指我们设法预测一个离散值的输出 良性或恶性。实际上,你可能有两个以上的可能的输出值,在分类问题中有另一种方法来绘制这些数据,
我们用不同的符号对应到一条线上。
Unsupervised Learning(无监督学习)
例子:
在无监督学习中我们使用的数据和之前不同,没有任何标签,都具有相同的标签或者都没有标签,我们得到一个数据集,我们不知道拿它做什么,我们只是被告知在这里有一个数据集,你能在其中找到某种结构吗,对于给定的数据集,无监督学习算法可能判定,该数据集包含两个不同的簇 ,
无监督学习算法可以把他们分成两簇,这就是聚类算法。其中有谷歌新闻就是应用聚类算法的例子。
例子:
假设一个宴会上只有两个人,两人同时说话,我们把两个麦克风放在房间里,两个麦克风与这两个人的距离不相同,每个麦克风记录了来自两人不同的声音组合,也许第一个人的声音在一号麦克风里会响一点,也许第二个人的声音在二号麦克风里更响一些,因为两个麦克风相对于两个说话者的位置是不同的,但每个麦克风都会录到两个说话者重叠的声音,让它帮你找出数据的结构,称为鸡尾酒会算法,此外,它还会分离出这两个被混合到一起的音频源
,要实现这样的算法有多复杂,
这样一行就可以解决问题,
---恢复内容结束---
Machine Learning的定义的更多相关文章
- 【Machine Learning】KNN算法虹膜图片识别
K-近邻算法虹膜图片识别实战 作者:白宁超 2017年1月3日18:26:33 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结 ...
- 【Machine Learning】机器学习及其基础概念简介
机器学习及其基础概念简介 作者:白宁超 2016年12月23日21:24:51 摘要:随着机器学习和深度学习的热潮,各种图书层出不穷.然而多数是基础理论知识介绍,缺乏实现的深入理解.本系列文章是作者结 ...
- 【机器学习Machine Learning】资料大全
昨天总结了深度学习的资料,今天把机器学习的资料也总结一下(友情提示:有些网站需要"科学上网"^_^) 推荐几本好书: 1.Pattern Recognition and Machi ...
- [Machine Learning & Algorithm]CAML机器学习系列2:深入浅出ML之Entropy-Based家族
声明:本博客整理自博友@zhouyong计算广告与机器学习-技术共享平台,尊重原创,欢迎感兴趣的博友查看原文. 写在前面 记得在<Pattern Recognition And Machine ...
- matlab基础教程——根据Andrew Ng的machine learning整理
matlab基础教程--根据Andrew Ng的machine learning整理 基本运算 算数运算 逻辑运算 格式化输出 小数位全局修改 向量和矩阵运算 矩阵操作 申明一个矩阵或向量 快速建立一 ...
- Machine Learning Algorithms Study Notes(6)—遗忘的数学知识
机器学习中遗忘的数学知识 最大似然估计( Maximum likelihood ) 最大似然估计,也称为最大概似估计,是一种统计方法,它用来求一个样本集的相关概率密度函数的参数.这个方法最早是遗传学家 ...
- Machine Learning Algorithms Study Notes(5)—Reinforcement Learning
Reinforcement Learning 对于控制决策问题的解决思路:设计一个回报函数(reward function),如果learning agent(如上面的四足机器人.象棋AI程序)在决定 ...
- [Machine Learning] 国外程序员整理的机器学习资源大全
本文汇编了一些机器学习领域的框架.库以及软件(按编程语言排序). 1. C++ 1.1 计算机视觉 CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库 OpenCV—它提供C++, C ...
- Machine Learning Algorithms Study Notes(4)—无监督学习(unsupervised learning)
1 Unsupervised Learning 1.1 k-means clustering algorithm 1.1.1 算法思想 1.1.2 k-means的不足之处 1 ...
随机推荐
- 浅谈HTTP和TCP的理解
TCP协议对应于传输层,而Http协议对应于应用层,Http协议是建立在TCP协议之上的,当浏览器需要从服务器获取网页数据的时候,会发出一次Http请求.HTTP会通过TCP建立一个连接通道,当HTT ...
- 【hadoop】 eclipse中的“run on hadoop”和打包成jar提交任务的区别
eclipse中的 调试运行 及 “run on hadoop”默认只是运行在单机上的,因为要想在集群中让程序分布式运行还要经历上传类文件.分发到各个节点等过程, 一个简单的“run on hadoo ...
- [NOI2010]能量采集 BZOJ2005 数学(反演)&&欧拉函数,分块除法
题目描述 栋栋有一块长方形的地,他在地上种了一种能量植物,这种植物可以采集太阳光的能量.在这些植物采集能量后,栋栋再使用一个能量汇集机器把这些植物采集到的能量汇集到一起. 栋栋的植物种得非常整齐,一共 ...
- maven No compiler is provided environment
eclipse maven操作正常出现的No compiler is provided in this environment. Perhaps you are running on a JRE ra ...
- Qt 学习之路 2(58):编辑数据库外键
Qt 学习之路 2(58):编辑数据库外键(skip) 豆子 2013年7月12日 Qt 学习之路 2 13条评论 前面几章我们介绍了如何对数据库进行操作以及如何使用图形界面展示数据库数据.本章我们将 ...
- Qt 学习之路 2(52):使用拖放
Qt 学习之路 2(52):使用拖放 豆子 2013年5月21日 Qt 学习之路 2 17条评论 拖放(Drag and Drop),通常会简称为 DnD,是现代软件开发中必不可少的一项技术.它提供了 ...
- Qt 学习之路 2(49):自定义只读模型
Qt 学习之路 2(49):自定义只读模型 豆子 2013年5月5日 Qt 学习之路 2 18条评论 model/view 模型将数据与视图分割开来,也就是说,我们可以为不同的视图,QListView ...
- LeetCode153.寻找旋转排序数组中的最小值
153.寻找旋转排序数组中的最小值 描述 假设按照升序排序的数组在预先未知的某个点上进行了旋转. ( 例如,数组 [0,1,2,4,5,6,7] 可能变为 [4,5,6,7,0,1,2] ). 请找出 ...
- 【算法笔记】B1020 月饼
1020 月饼 (25 分) 月饼是中国人在中秋佳节时吃的一种传统食品,不同地区有许多不同风味的月饼.现给定所有种类月饼的库存量.总售价.以及市场的最大需求量,请你计算可以获得的最大收益是多少. 注意 ...
- BZOJ - 3489 KD树 范围计数 空间思维转换
题意:给定数列\(a[1...n]\),\(Q\)次查询\([L,R]\)中只出现一次的最大值 这道题的做法比较劲.. 对每个元素构造三维空间的点\((i,pre[i],next[i])\),查询\( ...