微软推 Azure 机器学习工具:Algorithm Cheat Sheet

[日期:2015-05-15] 来源:CSDN  作者:Linux [字体: ]
 

Azure Machine Learning Studio 有着大量的机器学习算法,现在你可以使用它来构建预测分析解决方案。这些算法可用于一般的机器学习:回归分析、分类、聚类和异常检测,且每一个都可以解决不同类型的机器学习问题。

现在的问题是,是否有什么工具之类的东西可帮助找出如何选择一个合适的机器学习算法,并根据具体的方案?

点击这里查看大图。

点击此处下载 Cheat Sheet:Microsoft Azure Machine Learning Algorithm Cheat Sheet

微软 Azure 的机器学习 Algorithm Cheat Sheet 旨在帮助你筛选可用的机器学习算法,并选择合适的一个来用于预测分析解决方案。Cheat Sheet 会询问你这两个问题:数据的性质、你工作想要解决的问题等,然后提出一个你可以尝试的算法的建议。

Azure Machine Learning Studio 为你提供了灵活的体验:尝试一种算法,如果你对结果不满意,那就尝试另一种。(Azure 机器学习是免费的,也不需要什么许可,点击这里试用。)这里有一个来自 Azure Machine Learning Gallery 的例子,该实验是尝试用几种不同的算法用在相同的数据上,然后进行结果比较:Compare Multi-class Classifiers: Letter recognition

关于 Azure Machine Learning Studio

Azure Machine Learning Studio 提供了许多不同的先进机器学习算法来帮助你生成分析模型。首先,确定要执行的机器学习任务的常规类型,因为归组在每个类别中的算法适合特定的预测任务。

选择一种算法并配置其参数后,可以使用训练模块之一通过选定算法运行数据,也可以使用扫描参数循环访问所有可能的参数并确定任务和数据的最佳配置。

学习算法的类别

Azure Machine Learning Studio 提供了以下各种类型的机器学习算法,它们按典型的机器学习方案来分组。

  • 异常检测

异常检测包含许多机器学习方面的重要任务,异常检测技术适用于各种行业:

1. 标识可能具有欺诈性的事务。
2. 学习指示发生了网络入侵的模式
3. 查找异常的患者群集
4. 检查输入到系统的值

根据定义,异常属于罕见事件,因此可能很难收集有代表性的数据样本来进行建模。本节中包含的算法已经过专门设计,可以解决异常检测的核心构建和训练模型问题。

此类别包括以下模块:单类支持向量机、基于 PCA 的异常检测。

  • 分类

分类算法用于预测单个数据实例的类或类别。例如,电子邮件筛选器使用二元分类来确定某封电子邮件是否为垃圾邮件。有两种形式的分类任务。一种是旨在 预测两个结果之一的二元分类,另一种是旨在预测多个结果之一的多类分类。分类算法的输出为分类器,可用于预测新的(未标记)实例的标签。

类别 Modules References.Machine Learning.Initialize Model.Classification 包括以下模块:多类决策林、多类决策森林、多类逻辑回归、多类神经网络、一对多多类、双类平均感知器、双类贝叶斯点机、双类提升决策树、双类决策林、双类 决策森林、双类逻辑回归、双类神经网络、双类支持向量机、双类局部深层支持向量机。

  • 聚类

聚类算法可以基于一组特征学习了解如何将一组项分组在一起。例如,聚类通常在文本分析中使用,以便将包含常见单词的文本片段分组在一起。可以使用聚 类通过找出最接近的数据点,然后确定每种组合的质心或中心点,来分组未标记的数据。训练算法后,可以使用它来预测数据实例所属的聚类。

类别 Modules References.Machine Learning.Initialize Model.Clustering 包括模块:K 平均值聚类

  • 回归

回归算法是学习预测单个数据实例的实际函数字的算法。例如,房价预测器可以使用回归算法来预测当前的房价。回归算法确定要执行回归函数的数据的每个特征分布。算法训练用于预测标记数据的函数后,可用于预测新的(未标记)实例的标签。

类别 Modules References.Machine Learning.Initialize Model.Regression

英文原文:Microsoft Azure Machine Learning Algorithm Cheat Sheet

本文永久更新链接地址http://www.linuxidc.com/Linux/2015-05/117567.htm

微软推 Azure 机器学习工具:Algorithm Cheat Sheet的更多相关文章

  1. 微软开源自动机器学习工具NNI安装与使用

    微软开源自动机器学习工具 – NNI安装与使用   在机器学习建模时,除了准备数据,最耗时耗力的就是尝试各种超参组合,找到最佳模型的过程了.对于初学者来说,常常是无从下手.即使是对于有经验的算法工程师 ...

  2. 【重磅】微软开源自动机器学习工具 - NNI

    [重磅]微软开源自动机器学习工具 - NNI 在机器学习建模时,除了准备数据,最耗时耗力的就是尝试各种超参组合,找到模型最佳效果的过程了.即使是对于有经验的算法工程师和数据科学家,有时候也很难把握其中 ...

  3. zz【重磅】微软开源自动机器学习工具 - NNI

    [重磅]微软开源自动机器学习工具 - NNI 在机器学习建模时,除了准备数据,最耗时耗力的就是尝试各种超参组合,找到模型最佳效果的过程了.即使是对于有经验的算法工程师和数据科学家,有时候也很难把握其中 ...

  4. 工具 - 正则Cheat sheet

  5. NNI (Neurol Network Intelligence) 是微软开源的自动机器学习工具

    NNI (Neurol Network Intelligence) 是微软开源的自动机器学习工具 https://www.cnblogs.com/ms-uap/p/9719071.html [重磅]微 ...

  6. Azure机器学习入门(二)创建Azure机器学习工作区

    我们将开始深入了解如何使用Azure机器学习的基本功能,帮助您开始迈向Azure机器学习的数据科学家之路. Azure ML Studio (Azure Machine Learning Studio ...

  7. Azure机器学习入门(一)

    我们开始深入学习Azure机器学习的基本原理并为您开启伟大的数据科学之门.Azure 机器学习的一个重要特征就是在构建预测分析方案时,它能够方便地将开发模式集成为可重复的工作流模式.这就使得Azure ...

  8. Azure机器学习入门(三)创建Azure机器学习实验

    在此动手实践中,我们将在Azure机器学习Studio中一步步地开发预测分析模型,首先我们从UCI机器学习库的链接下载普查收入数据集的样本并开始动手实践: http://archive.ics.uci ...

  9. Microsoft宣布为Power BI提供AI模型构建器,关键驱动程序分析和Azure机器学习集成

    微软的Power BI现在是一种正在大量结合人工智能(AI)的商业分析服务,它使用户无需编码经验或深厚的技术专长就能够创建报告,仪表板等.近日西雅图公司宣布推出几款新的AI功能,包括图像识别和文本分析 ...

随机推荐

  1. Java基础--接口和抽象类的区别

    任何不谈使用方法的空理论都是耍流氓 使用场景 · 如果你拥有一些方法并且想让它们中的一些有默认实现,那么使用抽象类吧(Java1.8中接口也可以这么做了) · 如果你想实现多重继承,那么你必须使用接口 ...

  2. Idea在@Autowired注入时报错

    Could not autowire. No beans of 'UserDao' type found 如图,是因为idea检测能力太强,一旦没有找到实现类就会报错,但是我试了,这里其实是注入进来了 ...

  3. zookeeper集群的简单搭建

    zookeeper简单介绍 zookeeper是一个为分布式应用提供一致性服务的软件,它是开源的Hadoop项目的一个子项目,并根据google发表的一篇论文来实现的.zookeeper为分布式系统提 ...

  4. C++继承(一) 三种继承方式

    继承定义 继承是使代码可以复用的重要手段,也是面向对象程序设计的核心思想之一. 继承就是不修改原有的类,直接利用原来的类的属性和方法并进行扩展.原来的类称为基类,继承的类称为派生类,他们的关系就像父子 ...

  5. eclipse 包 取消代码第一行package包名 自动补全时取消自动引入包名 修改名字 取消引用 自动导入publilc static void main(String[] args) {}

    --项目 --包 包是为了管理类文件,同个包下不允许同名类文件,但不同包就可以,把类放在包里是规范 (https://zhidao.baidu.com/question/239471930532952 ...

  6. ref、out参数

    ref和out都是表示按引用传递.与指针类似,直接指向同一内存. 按值传递参数的方法永远不可能改变方法外的变量,需要改变方法外的变量就必须按引用传递参数. 传递参数的方法,在C语言里,用指针.在C#里 ...

  7. 浅议极大似然估计(MLE)背后的思想原理

    1. 概率思想与归纳思想 0x1:归纳推理思想 所谓归纳推理思想,即是由某类事物的部分对象具有某些特征,推出该类事物的全部对象都具有这些特征的推理.抽象地来说,由个别事实概括出一般结论的推理称为归纳推 ...

  8. Python的优势及应用领域

    Python的优势 Python是一门解释型语言,是比较容易入门. Python的程序代码更接近英语,更好好理解. Python的扩展库非常丰富. Python与C的粘合性非常好. Python的缺点 ...

  9. 【JS】前端文件下载(无刷新)方法总结

    #传统方法 利用iframe 或 form.submit 或 windows.open直接向后端发请求,后端返回文件流,后端处理成功后会直接返回到页面,浏览器会整理并打开自己的保存下载文件机制 . 1 ...

  10. Kubernetes基本功能

    说明 目前kubernetes的资料介绍很多也很深刻,本文只是做一个针对自己学习k8s过程的介绍,仅仅是学习笔记的记录. 一.基本使用 1. 命令行 集群信息 Namespace 信息 Control ...