微软推 Azure 机器学习工具:Algorithm Cheat Sheet

[日期:2015-05-15] 来源:CSDN  作者:Linux [字体: ]
 

Azure Machine Learning Studio 有着大量的机器学习算法,现在你可以使用它来构建预测分析解决方案。这些算法可用于一般的机器学习:回归分析、分类、聚类和异常检测,且每一个都可以解决不同类型的机器学习问题。

现在的问题是,是否有什么工具之类的东西可帮助找出如何选择一个合适的机器学习算法,并根据具体的方案?

点击这里查看大图。

点击此处下载 Cheat Sheet:Microsoft Azure Machine Learning Algorithm Cheat Sheet

微软 Azure 的机器学习 Algorithm Cheat Sheet 旨在帮助你筛选可用的机器学习算法,并选择合适的一个来用于预测分析解决方案。Cheat Sheet 会询问你这两个问题:数据的性质、你工作想要解决的问题等,然后提出一个你可以尝试的算法的建议。

Azure Machine Learning Studio 为你提供了灵活的体验:尝试一种算法,如果你对结果不满意,那就尝试另一种。(Azure 机器学习是免费的,也不需要什么许可,点击这里试用。)这里有一个来自 Azure Machine Learning Gallery 的例子,该实验是尝试用几种不同的算法用在相同的数据上,然后进行结果比较:Compare Multi-class Classifiers: Letter recognition

关于 Azure Machine Learning Studio

Azure Machine Learning Studio 提供了许多不同的先进机器学习算法来帮助你生成分析模型。首先,确定要执行的机器学习任务的常规类型,因为归组在每个类别中的算法适合特定的预测任务。

选择一种算法并配置其参数后,可以使用训练模块之一通过选定算法运行数据,也可以使用扫描参数循环访问所有可能的参数并确定任务和数据的最佳配置。

学习算法的类别

Azure Machine Learning Studio 提供了以下各种类型的机器学习算法,它们按典型的机器学习方案来分组。

  • 异常检测

异常检测包含许多机器学习方面的重要任务,异常检测技术适用于各种行业:

  1. 1. 标识可能具有欺诈性的事务。
  2. 2. 学习指示发生了网络入侵的模式
  3. 3. 查找异常的患者群集
  4. 4. 检查输入到系统的值

根据定义,异常属于罕见事件,因此可能很难收集有代表性的数据样本来进行建模。本节中包含的算法已经过专门设计,可以解决异常检测的核心构建和训练模型问题。

此类别包括以下模块:单类支持向量机、基于 PCA 的异常检测。

  • 分类

分类算法用于预测单个数据实例的类或类别。例如,电子邮件筛选器使用二元分类来确定某封电子邮件是否为垃圾邮件。有两种形式的分类任务。一种是旨在 预测两个结果之一的二元分类,另一种是旨在预测多个结果之一的多类分类。分类算法的输出为分类器,可用于预测新的(未标记)实例的标签。

类别 Modules References.Machine Learning.Initialize Model.Classification 包括以下模块:多类决策林、多类决策森林、多类逻辑回归、多类神经网络、一对多多类、双类平均感知器、双类贝叶斯点机、双类提升决策树、双类决策林、双类 决策森林、双类逻辑回归、双类神经网络、双类支持向量机、双类局部深层支持向量机。

  • 聚类

聚类算法可以基于一组特征学习了解如何将一组项分组在一起。例如,聚类通常在文本分析中使用,以便将包含常见单词的文本片段分组在一起。可以使用聚 类通过找出最接近的数据点,然后确定每种组合的质心或中心点,来分组未标记的数据。训练算法后,可以使用它来预测数据实例所属的聚类。

类别 Modules References.Machine Learning.Initialize Model.Clustering 包括模块:K 平均值聚类

  • 回归

回归算法是学习预测单个数据实例的实际函数字的算法。例如,房价预测器可以使用回归算法来预测当前的房价。回归算法确定要执行回归函数的数据的每个特征分布。算法训练用于预测标记数据的函数后,可用于预测新的(未标记)实例的标签。

类别 Modules References.Machine Learning.Initialize Model.Regression

英文原文:Microsoft Azure Machine Learning Algorithm Cheat Sheet

本文永久更新链接地址http://www.linuxidc.com/Linux/2015-05/117567.htm

微软推 Azure 机器学习工具:Algorithm Cheat Sheet的更多相关文章

  1. 微软开源自动机器学习工具NNI安装与使用

    微软开源自动机器学习工具 – NNI安装与使用   在机器学习建模时,除了准备数据,最耗时耗力的就是尝试各种超参组合,找到最佳模型的过程了.对于初学者来说,常常是无从下手.即使是对于有经验的算法工程师 ...

  2. 【重磅】微软开源自动机器学习工具 - NNI

    [重磅]微软开源自动机器学习工具 - NNI 在机器学习建模时,除了准备数据,最耗时耗力的就是尝试各种超参组合,找到模型最佳效果的过程了.即使是对于有经验的算法工程师和数据科学家,有时候也很难把握其中 ...

  3. zz【重磅】微软开源自动机器学习工具 - NNI

    [重磅]微软开源自动机器学习工具 - NNI 在机器学习建模时,除了准备数据,最耗时耗力的就是尝试各种超参组合,找到模型最佳效果的过程了.即使是对于有经验的算法工程师和数据科学家,有时候也很难把握其中 ...

  4. 工具 - 正则Cheat sheet

  5. NNI (Neurol Network Intelligence) 是微软开源的自动机器学习工具

    NNI (Neurol Network Intelligence) 是微软开源的自动机器学习工具 https://www.cnblogs.com/ms-uap/p/9719071.html [重磅]微 ...

  6. Azure机器学习入门(二)创建Azure机器学习工作区

    我们将开始深入了解如何使用Azure机器学习的基本功能,帮助您开始迈向Azure机器学习的数据科学家之路. Azure ML Studio (Azure Machine Learning Studio ...

  7. Azure机器学习入门(一)

    我们开始深入学习Azure机器学习的基本原理并为您开启伟大的数据科学之门.Azure 机器学习的一个重要特征就是在构建预测分析方案时,它能够方便地将开发模式集成为可重复的工作流模式.这就使得Azure ...

  8. Azure机器学习入门(三)创建Azure机器学习实验

    在此动手实践中,我们将在Azure机器学习Studio中一步步地开发预测分析模型,首先我们从UCI机器学习库的链接下载普查收入数据集的样本并开始动手实践: http://archive.ics.uci ...

  9. Microsoft宣布为Power BI提供AI模型构建器,关键驱动程序分析和Azure机器学习集成

    微软的Power BI现在是一种正在大量结合人工智能(AI)的商业分析服务,它使用户无需编码经验或深厚的技术专长就能够创建报告,仪表板等.近日西雅图公司宣布推出几款新的AI功能,包括图像识别和文本分析 ...

随机推荐

  1. Scanner的使用 猜数字 +猜电影

    猜数字public class Main { public static void main(String[] args) { int random=(int)(Math.random()*100)+ ...

  2. 浅谈kafka streams

    随着数据时代的到来,数据的实时计算也越来越被大家重视.实时计算的一个重要方向就是实时流计算,目前关于流计算的有很多成熟的技术实现方案,比如Storm.Spark Streaming.flink等.我今 ...

  3. nodejs 搭建本地静态服务器

    1. http-server 参看 https://www.npmjs.com/package/http-server 使用http-server搭建本地静态服务器 全局安装http-server n ...

  4. os与sys模块

    os 1.os.pardir #获取当前目录的父目录字符串名:('..') 2.os.mkdir('dirname') #创建单级目录:相当于shell中mkdir dirname 3.os.make ...

  5. 用video标签流式加载

    video标签 浏览器的video标签通常是接收一个src属性,然后浏览器就会根据这个src属性来自动加载视频.这个过程是浏览器来加载video的. 这种方式有什么问题吗? mp4文件不能流式加载 w ...

  6. 在graphviz中创建可点击的图形

    1.创建一个dot文件,在节点属性中使用URL关键字: target关键字指定链接打开的方式 //test.dot digraph Arch { A; B [URL="http://docs ...

  7. 计算指定文件的MD5值

    /// <summary> /// 计算指定文件的MD5值 /// </summary> /// <param name="fileName"> ...

  8. 超越村后端开发(5:远程同步本地与服务器端的MySQL数据库)

    1.同步MySQL数据库 服务器选用的华为云,安装了Ubuntu18.04,华为云默认是以root用户登录的. 1.使用Xshell6连接华为云 ls 2.Ubuntu18.04安装MySQL5.7 ...

  9. (模拟 打好基础)nyoj1363-计划日

    1363-计划日 内存限制:256MB 时间限制:3000ms 特判: No通过数:21 提交数:79 难度:1 题目描述: 为什么花那么多时间.精力还是学不好学不通,如何把握各科目的重难点,期中和期 ...

  10. 第八周博客作业<西北师范大学|李晓婷>

    1.助教博客链接:https://home.cnblogs.com/u/lxt-/ 2.作业要求链接:http://www.cnblogs.com/nwnu-daizh/p/10687492.html ...