什么是(监督)机器学习?简而言之,它是以下几点:
  • ML系统学习如何组合输入以产生对从未见过的数据的有用预测。

我们来探讨基本的机器学习术语。

标签

一个标签是我们预测物品的属性,比如变量y在简单线性回归变量。标签可以是小麦的未来价格,图片中显示的动物的种类,音频剪辑的含义或任何东西。

特征

一个特征是一个输入变量 - x简单线性回归中的变量。一个简单的机器学习项目可能会使用单一功能,而更复杂的机器学习项目可能会使用数百万个功能,具体如下:

{X1,X2,。。。Xñ}

在垃圾邮件检测器示例中,功能可能包括以下内容:

  • 电子邮件中的文字
  • 寄件人地址
  • 发送电子邮件的时间
  • 电子邮件包含短语“一个奇怪的把戏”。

例子

一个例子是数据的特定实例x。(我们把 X粗体,以表明它是一个载体。)我们分手的例子分为两类:

  • 标记的例子
  • 未标记的例子

标记的例子包括(多个)特征和标签。那是:

labeled examples: {features, label}: (x, y)

使用标记的示例来训练模型。在我们的垃圾邮件检测器示例中,标记的示例将是用户明确标记为“垃圾邮件”或“非垃圾邮件”的单个电子邮件。

例如,下表显示了来自 包含加利福尼亚州房价信息的数据集中的 5个标记示例:

住房中医年龄
(功能)
totalRooms
(功能)
totalBedrooms
(功能)
medianHouseValue
(标签)
15 5612 1283 66900
19 7650 1901 80100
17 720 174 85700
14 1501 337 73400
20 1454 326 65500

一个未标记的例子包含的特征,但不是标签,如下:
  unlabeled examples: {features, ?}: (x, ?)

一旦我们用标记示例对我们的模型进行了训练,我们就可以使用该模型来预测未标记示例上的标签。在垃圾邮件检测器中,未标记的示例是人类尚未标记的新电子邮件。

模型

模型定义了要素和标签之间的关系。例如,垃圾邮件检测模型可能会将某些功能强烈地与“垃圾邮件”相关联。让我们强调模型的两个阶段:

  • 训练意味着创造或学习模型。也就是说,您将显示标有示例的模型,并使模型逐渐学习特征与标签之间的关系。
  • 预测意味着将训练的模型应用于未标记的例子。也就是说,你使用训练好的模型进行有用的预测(y')。例如,在推理过程中,您可以预测medianHouseValue新的未标记示例。

回归与分类

一个回归模型预测连续值。例如,回归模型预测回答如下问题:

  • 加州的房子价值是多少?
  • 用户点击此广告的概率是多少?

一个分类模型预测离散值。例如,分类模型可以做出预测来回答以下问题:

  • 给定的电子邮件是垃圾邮件还是垃圾邮件?
  • 这是一只狗,一只猫还是一只仓鼠的图像?

关键术语

查看原文:http://www.mtcnn.com/?p=109

Google内部培训过1.8万人的机器学习速成课的更多相关文章

  1. Google内部邮件:如何进行高效的时间管理能量波动图

    Google内部邮件:如何进行高效的时间管理能量波动图 发布时间: 2015-12-16 22:16:50| 阅读数:462 views 最近,我给团队内部写了一封简单的邮件.主要内容是征询他们,如何 ...

  2. 每年有20万人进军IT行业,为何还会人才短缺?

    众所周知,IT行业是个高薪行业,也是很多人的梦想职业,在全球最缺人的十大行业中IT行业居首位. 但是现在很多人都有一个疑问: 几乎每所大学里都有计算机技术相关专业,再加上IT培训机构的输出,每年培养出 ...

  3. 【原创分析帖】据说Google内部有史以来最难的一道面试题

    逛技术平台的时候,刷到一道算法题,一眼看去,就被其开头吸引了: 摘自知乎某 Google 分布式大神的一道题,技术是Google内部出的有史以来最难的一道题 嗯,距离下班还有一段时间,就看看把. 题目 ...

  4. 这款打怪升级的小游戏,7 年前出生于 GitHub 社区,如今在谷歌商店有 8 万人打了满分

    今天我在 GitHub 摸鱼寻找新的"目标"时,发现了一个开源项目是 RougeLike 类的角色扮演游戏「破碎版像素地牢」(Shattered Pixel Dungeon)类似魔 ...

  5. 公司内部培训AlwaysOn PPT分享

    公司内部培训AlwaysOn PPT分享 下载地址: http://files.cnblogs.com/files/lyhabc/alwayson.ppt

  6. 公司内部培训SQL Server传统索引结构PPT分享

    公司内部培训SQL Server传统索引结构PPT分享 下载地址 http://files.cnblogs.com/files/lyhabc/SQLServer%E4%BC%A0%E7%BB%9F%E ...

  7. 第一章 基础设施,1.3 阿里视频云ApsaraVideo是怎样让4000万人同时狂欢的(作者:蔡华)

    1.3 阿里视频云ApsaraVideo是怎样让4000万人同时狂欢的 前言 在今年的双11中,双11天猫狂欢夜的直播成为一大亮点. 根据官方披露数据,直播总观看人数超4257万,同时观看人数峰值达5 ...

  8. asp.net web api内部培训资料

    最近在公司进行了一次asp.net web api的分享吧,不算是培训. 可能大家有些人对Web API的推出目的还不是很了解,可以看看微软官方的定义,其实是为了提供一个好的REST Service方 ...

  9. Google 内部代码是不支持异常(Excepton)的,C++ 异常的优劣之处有许多讨论(知乎上的讨论)

    最近 Google 开源了其内部多年使用的 C++ 代码库 Abseil 作为 C++ 标准库的补充,并会对其进行持续更新,本文对其进行简要介绍. 一句话概括,这个库的特点是用 C++ 11 的代码实 ...

随机推荐

  1. Ubuntu16.04安装搜狗拼音输入法(中文输入法)[转]

    本文转载自:https://www.cnblogs.com/darklights/p/7722861.html 虽然网上有很多教程,但是我觉得我的很适合那些真正的小白... 1.下载文件 由于我要给多 ...

  2. MysQL使用一查询

    简介 查询的基本语法 select * from 表名; from关键字后面写表名,表示数据来源于是这张表 select后面写表中的列名,如果是*表示在结果中显示表中所有列 在select后面的列名部 ...

  3. 【bzoj2333 & luoguP3273】棘手的操作(线段树合并)

    题目传送门:bzoj2333 luoguP3273 这操作还真“棘手”..听说这题是可并堆题?然而我不会可并堆.于是我就写了线段数合并,然后调了一晚上,数据结构毁一生!!!QAQ…… 其实这题也可以把 ...

  4. .Net Core Linux部署之进程守护 Supervisor 安装配置

    1.Supervisor 安装 //安装easy_install yum install python-setuptools //安装Supervisor easy_install superviso ...

  5. 在服务器 部署 asp.net core 报502.5的错

    HTTP Error 502.5 - Process Failure 如果 IIS 该安装的都装好了的话,那就需要安装一个.net core sdk,链接如下: https://www.microso ...

  6. mybatis的一对多

    1.配置文件 db.properties db.driver=com.mysql.jdbc.Driver db.url=jdbc:mysql://localhost:3306/demo?useUnic ...

  7. 【乱码】Request QueryString 编码,传值乱码的几种情况和解决办法(单页,多页)

    自己的项目还好,合作接口神马的传值乱码是很常见的. 遇到了几次这种恶心情况,积累了一点经验,有不对的地方欢迎指正. 乱码原因: 一般来说,常用的编码不是utf-8就是gb2312,一样的 HttpUt ...

  8. Glibc-2.3.4编译

    $tar xf Glibc2.3.4.tar.bz2 $mkdir build_glibc $cd build_glibc ../glibc-2.3.4/configure --prefix=/too ...

  9. P3600 随机数生成器

    本文版权归ljh2000和博客园共有,欢迎转载,但须保留此声明,并给出原文链接,谢谢合作. 本文作者:ljh2000 作者博客:http://www.cnblogs.com/ljh2000-jump/ ...

  10. 项目管理工具:Maven

    Maven是什么,作用是什么? Maven是项目管理工具,主要有两大作用:项目构建和依赖管理.项目构建就是项目编译.测试.集成发布实现自动化,依赖管理是很方便的功能,只要把当前项目所依赖的构件(jar ...