Microsoft Azure云服务推出机器学习的模块,用户只需上传数据,利用机器学习模块提供的一些算法接口和R语言或别的语言接口,就能利用Microsoft Azure强大的云计算能力来实现自己的机器学习的任务。

本文浅尝了该机器学习模块,参照官方实例和帮助文档,完成了一个简单的应用实例,具体步骤如下。

1、新建workspace

注意,在填写workspace owner,一定要填写一个有效的windows live 账号

进入创建的workspace,界面如下图所示

2、上传数据

数据源:http://archive.ics.uci.edu/ml/datasets/Statlog+(German+Credit+Data)

下载名为个变量,1000条信用记录,其中700条问低风险,300条为高风险。注意,由于Azure Machine Learning stidio 只支持csv文件,所以需要把german.data转化为csv文件。

点击ML studio下方的"+new"链接,按下图所示将数据已建立好workspace中

3、新建Azure ML的实验

点击ML studio下方的"+new"链接,选择Experiment选项,打开如下界面后

第一步,可以给这个实验添加一个标题,本文命名为"Experiment by Jiahua"

第二步,在左侧找到上传的数据,名字为上传数据是给定的数据名字,本文为"UCI German Credit Card Data",将数据拖到中间的工作区,然后右侧会给出数据的描述信息。数据进入工作区之后,用一个圆角的矩形表示,矩形下有一个圆圈,称为"output port",将鼠标放在上面并点击右键后,可以进行数据可视化等操作。拖动圆圈,可以指向下一个数据处理操作。

第三步,添加完数据集之后,就需要对数据集进行相应的处理,包括数据预处理,训练样本和测试样本划分,选择机器学习算法等等,详细操作课参加官方实例。完成上述操作后,一个可视化的机器学习过程就完成,如下图所示:

第四步,模型运行。完成上述操作后,就就可以运行程序了,点击下方的"Run",模型就会运行,每个模块运行完成之后会在右上方标示一个绿色小勾,如果每个模块或步骤出错了,会在同样的地方出现一个红色的,鼠标放上去之后就会提示错误的类型。

第五步,查看结果,在"Evaluate Model"方框下的圆点处点击右键,选择"Visualize"即可查看模型运行结果,部分结果如下图所示:

5、小结

这样一个利用Azure云服务的机器学习实例就完成了,当然如果必要的的话还可以将完成模型发布到web服务器上,这里就不细述,可以参考帮助文档。

利用Azure云服务做机器学习研究,给我最大的体会是可视化的操作步骤使得算法的运行过程更加清晰明聊,将算法拆分为数据准备、数据预处理、训练数据和测试数据分割、模型选择、模型参数调整、模型评价等环节,每个环节以处理框的形式出现,通过带箭头的连线,可以清晰的看出每个环节的输入和输出关系,从而研究者能更容易的抓住和控制算法的要点。

初步的尝试就到此结束,由于时间和能力的关系,本文只做了最简单的尝试,叙述过程省略了很多细节,尤其是在新建实验部分,如果感兴趣可以详细查阅官方帮助文档。

利用Microsoft Azure Machine Learning Studio创建机器学习实例的更多相关文章

  1. Microsoft Azure Machine Learning Studio

    随着机器学习(ML)成为软件行业的主流,重要的是要了解它的工作原理,并将其置于开发栈中.了解如何为您的应用程序构建ML服务,您可以确定您的ML应用程序中的机会,实施ML,并与您的团队的ML专业人士清楚 ...

  2. 利用Microsoft Sql Server Management studio 创建数据库的示例

    利用Microsoft Sql Server Management studio 创建数据库的示例方法如下:   一.打开安装好的Microsoft Sql Server Management stu ...

  3. Azure Machine Learning

    About me In my spare time, I love learning new technologies and going to hackathons. Our hackathon p ...

  4. Machine Learning - XI. Machine Learning System Design机器学习系统的设计(Week 6)

    http://blog.csdn.net/pipisorry/article/details/44119187 机器学习Machine Learning - Andrew NG courses学习笔记 ...

  5. [Machine Learning & Algorithm]CAML机器学习系列2:深入浅出ML之Entropy-Based家族

    声明:本博客整理自博友@zhouyong计算广告与机器学习-技术共享平台,尊重原创,欢迎感兴趣的博友查看原文. 写在前面 记得在<Pattern Recognition And Machine ...

  6. [Machine Learning & Algorithm]CAML机器学习系列1:深入浅出ML之Regression家族

    声明:本博客整理自博友@zhouyong计算广告与机器学习-技术共享平台,尊重原创,欢迎感兴趣的博友查看原文. 符号定义 这里定义<深入浅出ML>系列中涉及到的公式符号,如无特殊说明,符号 ...

  7. Build a Machine Learning Portfolio(构建机器学习投资组合)

    Complete Small Focused Projects and Demonstrate Your Skills (完成小型针对性机器学习项目,证明你的能力) A portfolio is ty ...

  8. 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 11—Machine Learning System Design 机器学习系统设计

    Lecture 11—Machine Learning System Design 11.1 垃圾邮件分类 本章中用一个实际例子: 垃圾邮件Spam的分类 来描述机器学习系统设计方法.首先来看两封邮件 ...

  9. Roles on a Machine Learning Project (机器学习项目中的角色)

    原文 :https://medium.com/machine-learning-in-practice/roles-on-a-machine-learning-project-216903a6dc12 ...

随机推荐

  1. POJ1416——Shredding Company(DFS)

    Shredding Company DescriptionYou have just been put in charge of developing a new shredder for the S ...

  2. 再分析 返回值加引用&,const

    本文主要分析,返回&,和返回值加const的作用. 返回& 定义一个数组模板: template<class T>class Array{ enum{size = 100} ...

  3. 工具----IcoFX

    IcoFX IcoFX 是一款免费的图标编辑工具,让您轻松创建 Windows XP 和 Windows Vista 图标. 在编辑区您可以轻松的预览.保存.更改您的图标.您可以将您喜欢的图像转换为图 ...

  4. C++ volatile的作用

    volatile的作用     2006-10-23 13:44:21 大 中 小 关键在于两个地方:     1. 编译器的优化 (请高手帮我看看下面的理解) 在本次线程内, 当读取一个变量时,为提 ...

  5. Eclipse环境下JBoss调试,解决引用的工程不被部署的问题

    其实算是一个很小的经验,在eclipse环境下进行jboss的部署,因为要定义某公共包的问题,将代码down下来做了个工程,部署时发现jboss提示:class not found! 从jboss部署 ...

  6. SCOI2009windy数

    数位DP,还不怎么会…… 其中calc函数的计算分为三部分: 第一部分:统计最高位为0的情况,或者说不足最高位位数的数的个数 第二部分:统计最高位为1到a[len]-1的情况,直接调用数组即可 第三部 ...

  7. git参考书籍

    Pro GIt 简体中文版 http://iissnan.com/progit/

  8. JavaScript中定时器

    JavaScript提供定时执行代码的功能,叫做定时器(timer),主要由setTimeout()和setInterval()这两个函数来完成.它们向任务队列添加定时任务. setTimeout() ...

  9. html语意化标签

    一.布局的理解误区 网络上流行管新型的布局方式叫“DIV+CSS”,其实是一个错误的理解,导致了很多人过度依赖 与滥用DIV标签, HTML提供了我们一共七八十个标签,其中常用的有三十个左右,DIV不 ...

  10. SqlServer中decimal(numeric )、float 和 real 数据类型的区别[转]

    decimal(numeric )             同义,用于精确存储数值 float 和 real                      不能精确存储数值   decimal 数据类型最 ...