Google内部培训过1.8万人的机器学习速成课
什么是(监督)机器学习?简而言之,它是以下几点:
- ML系统学习如何组合输入以产生对从未见过的数据的有用预测。
我们来探讨基本的机器学习术语。
标签
一个标签是我们预测物品的属性,比如变量y
在简单线性回归变量。标签可以是小麦的未来价格,图片中显示的动物的种类,音频剪辑的含义或任何东西。
特征
一个特征是一个输入变量 - x
简单线性回归中的变量。一个简单的机器学习项目可能会使用单一功能,而更复杂的机器学习项目可能会使用数百万个功能,具体如下:
在垃圾邮件检测器示例中,功能可能包括以下内容:
- 电子邮件中的文字
- 寄件人地址
- 发送电子邮件的时间
- 电子邮件包含短语“一个奇怪的把戏”。
例子
一个例子是数据的特定实例x。(我们把 X粗体,以表明它是一个载体。)我们分手的例子分为两类:
- 标记的例子
- 未标记的例子
甲标记的例子包括(多个)特征和标签。那是:
labeled examples: {features, label}: (x, y)
使用标记的示例来训练模型。在我们的垃圾邮件检测器示例中,标记的示例将是用户明确标记为“垃圾邮件”或“非垃圾邮件”的单个电子邮件。
例如,下表显示了来自 包含加利福尼亚州房价信息的数据集中的 5个标记示例:
住房中医年龄 (功能) |
totalRooms (功能) |
totalBedrooms (功能) |
medianHouseValue (标签) |
---|---|---|---|
15 | 5612 | 1283 | 66900 |
19 | 7650 | 1901 | 80100 |
17 | 720 | 174 | 85700 |
14 | 1501 | 337 | 73400 |
20 | 1454 | 326 | 65500 |
一个未标记的例子包含的特征,但不是标签,如下:
unlabeled examples: {features, ?}: (x, ?)
一旦我们用标记示例对我们的模型进行了训练,我们就可以使用该模型来预测未标记示例上的标签。在垃圾邮件检测器中,未标记的示例是人类尚未标记的新电子邮件。
模型
模型定义了要素和标签之间的关系。例如,垃圾邮件检测模型可能会将某些功能强烈地与“垃圾邮件”相关联。让我们强调模型的两个阶段:
- 训练意味着创造或学习模型。也就是说,您将显示标有示例的模型,并使模型逐渐学习特征与标签之间的关系。
- 预测意味着将训练的模型应用于未标记的例子。也就是说,你使用训练好的模型进行有用的预测(
y'
)。例如,在推理过程中,您可以预测medianHouseValue
新的未标记示例。
回归与分类
一个回归模型预测连续值。例如,回归模型预测回答如下问题:
- 加州的房子价值是多少?
- 用户点击此广告的概率是多少?
一个分类模型预测离散值。例如,分类模型可以做出预测来回答以下问题:
- 给定的电子邮件是垃圾邮件还是垃圾邮件?
- 这是一只狗,一只猫还是一只仓鼠的图像?
关键术语
查看原文:http://www.mtcnn.com/?p=109
Google内部培训过1.8万人的机器学习速成课的更多相关文章
- Google内部邮件:如何进行高效的时间管理能量波动图
Google内部邮件:如何进行高效的时间管理能量波动图 发布时间: 2015-12-16 22:16:50| 阅读数:462 views 最近,我给团队内部写了一封简单的邮件.主要内容是征询他们,如何 ...
- 每年有20万人进军IT行业,为何还会人才短缺?
众所周知,IT行业是个高薪行业,也是很多人的梦想职业,在全球最缺人的十大行业中IT行业居首位. 但是现在很多人都有一个疑问: 几乎每所大学里都有计算机技术相关专业,再加上IT培训机构的输出,每年培养出 ...
- 【原创分析帖】据说Google内部有史以来最难的一道面试题
逛技术平台的时候,刷到一道算法题,一眼看去,就被其开头吸引了: 摘自知乎某 Google 分布式大神的一道题,技术是Google内部出的有史以来最难的一道题 嗯,距离下班还有一段时间,就看看把. 题目 ...
- 这款打怪升级的小游戏,7 年前出生于 GitHub 社区,如今在谷歌商店有 8 万人打了满分
今天我在 GitHub 摸鱼寻找新的"目标"时,发现了一个开源项目是 RougeLike 类的角色扮演游戏「破碎版像素地牢」(Shattered Pixel Dungeon)类似魔 ...
- 公司内部培训AlwaysOn PPT分享
公司内部培训AlwaysOn PPT分享 下载地址: http://files.cnblogs.com/files/lyhabc/alwayson.ppt
- 公司内部培训SQL Server传统索引结构PPT分享
公司内部培训SQL Server传统索引结构PPT分享 下载地址 http://files.cnblogs.com/files/lyhabc/SQLServer%E4%BC%A0%E7%BB%9F%E ...
- 第一章 基础设施,1.3 阿里视频云ApsaraVideo是怎样让4000万人同时狂欢的(作者:蔡华)
1.3 阿里视频云ApsaraVideo是怎样让4000万人同时狂欢的 前言 在今年的双11中,双11天猫狂欢夜的直播成为一大亮点. 根据官方披露数据,直播总观看人数超4257万,同时观看人数峰值达5 ...
- asp.net web api内部培训资料
最近在公司进行了一次asp.net web api的分享吧,不算是培训. 可能大家有些人对Web API的推出目的还不是很了解,可以看看微软官方的定义,其实是为了提供一个好的REST Service方 ...
- Google 内部代码是不支持异常(Excepton)的,C++ 异常的优劣之处有许多讨论(知乎上的讨论)
最近 Google 开源了其内部多年使用的 C++ 代码库 Abseil 作为 C++ 标准库的补充,并会对其进行持续更新,本文对其进行简要介绍. 一句话概括,这个库的特点是用 C++ 11 的代码实 ...
随机推荐
- [翻译]纠正PostCSS的4大认识误区
市面上已经有很多的前端工具,再来引入新的前端工具,价值大不大?这主要取决于,它是否给开发人员提供了新的功能,是否值得花时间和精力去学习和使用? PostCSS出现时有一个很有趣的现象.像sass和le ...
- ArchLinux基本系统到XFCE4桌面搭建
Keep It Simple, Stupid 这是ArchLinux的哲学,更是一种人生哲学 好久没用linux了,这段时间因为一点点"破坏性"需求重新拾起linux用了一把 ...
- 设置iframe内表单target属性以兼容IE、Firefox【转载】
设置iframe内表单target属性以兼容IE.Firefox[转载] 2011年11月19日 haibor 今天有客户反应,在一产品网站的资源下载页面,用户登录提交后页面无反应! 经测 ...
- .net 获取当前电脑账户
string domainAndName = User.Identity.Name; ] { '\\' }, StringSplitOptions.RemoveEmptyEntries); strin ...
- js 弹出层,以及在javascript里定义层样式
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
- mongodb禁止外网访问以及添加账号
未曾料到被黑客勒索比特币的戏码竟然降临到我的身上,几个月的技术积累付之一炬.怪只怪自己学艺不精,心存侥幸和无知,不过经此一役,方知网络安全防护的重要性. 一直未给自己的mongodb数据库设置账号密码 ...
- mongodb安装、运行
1.下载安装: 切换到:/usr/local/ mkdir -p mongodb groupadd -g 800 mongodb useradd -u 801 -g mongodb mongodb c ...
- import sys sys.path.append(...)
模块搜索路径: 当我们试图加载一个模块时,Python会在指定的路径下搜索对应的.py文件,如果找不到,就会报错 默认情况下,Python解释器会搜索当前目录.所有已安装的内置模块和第三方模块,搜索路 ...
- Kotlin------函数和代码注释
定义函数 Kotlin定义一个函数的风格大致如下 访问控制符 fun 方法名(参数,参数,参数) : 返回值类型{ ... ... } 访问控制符:与Java有点差异,Kotlin的访问范围从大到小分 ...
- node-glob 匹配通配符
1.https://www.cnblogs.com/liulangmao/p/4552339.html 2.https://github.com/isaacs/node-glob 3.https:// ...