理解问题 出租车的车费不仅与距离有关,还涉及乘客数量,是否使用信用卡等因素(这是的出租车是指纽约市的).所以并不是一个简单的一元方程问题. 准备数据 建立一控制台应用程序工程,新建Data文件夹,在其目录下添加taxi-fare-train.csv与taxi-fare-test.csv文件,不要忘了把它们的Copy to Output Directory属性改为Copy if newer.之后,添加Microsoft.ML类库包. 加载数据 新建MLContext对象,及创建TextLoader…
机器学习的工作流程分为以下几个步骤: 理解问题 准备数据 加载数据 提取特征 构建与训练 训练模型 评估模型 运行 使用模型 理解问题 本教程需要解决的问题是根据网站内评论的意见采取合适的行动. 可用的训练数据集中,网站评论可能是有毒(toxic)(1)或者无毒(not toxic)(0)两种类型.这种场景下,机器学习中的分类任务最为适合. 分类任务用于区分数据内的类别(category),类型(type)或种类(class).常见的例子有: 识别情感是正面或是负面 将邮件按照是否为垃圾邮件归类…
机器学习算法 原理.实现与实践 —— 分类.标注与回归 1. 分类问题 分类问题是监督学习的一个核心问题.在监督学习中,当输出变量$Y$取有限个离散值时,预测问题便成为分类问题. 监督学习从数据中学习一个分类决策函数或分类模型,称为分类器(classifier).分类器对新的输入进行输出的预测,这个过程称为分类. 分类问题包括学习与分类两个过程.在学习的过程中,根据已知的训练样本数据集利用有效的学习方法学习一个分类器:在分类中,利用学习的分类器对新的输入实例进行分类. 对于训练数据集$(x_1,…
训练模型 在上一篇文章中,我们已经通过LearningPipeline训练好了一个“鸢尾花瓣预测”模型, var model = pipeline.Train<IrisData, IrisPrediction>(); 现在就可以让模型对一条没有人工标注结果的数据进行分析,返回一个预测结果. var prediction = model.Predict(new IrisData() { SepalLength = 3.3f, SepalWidth = 1.6f, PetalLength = 0.…
理解问题 客户细分需要解决的问题是按照客户之间的相似特征区分不同客户群体.这个问题的先决条件中没有可供使用的客户分类列表,只有客户的人物画像. 数据集 已有的数据是公司的历史商业活动记录以及客户的购买记录. offer.csv: Offer #,Campaign,Varietal,Minimum Qty (kg),Discount (%),Origin,Past Peak 1,January,Malbec,72,56,France,FALSE 2,January,Pinot Noir,72,17…
https://mp.weixin.qq.com/s/JwRXBNmXBaQM2GK6BDRqMw 选自GitHub 作者:Artur Suilin 机器之心编译 参与:蒋思源.路雪.黄小天 近日,Artur Suilin 等人发布了 Kaggle 网站流量时序预测竞赛第一名的详细解决方案.他们不仅公开了所有的实现代码,同时还详细解释了实现的模型与经验.机器之心简要介绍了他们所实现的模型与经验,更详细的代码请查看 GitHub 项目. GitHub 项目地址:https://github.com…
写在前面 准备近期将微软的machinelearning-samples翻译成中文,水平有限,如有错漏,请大家多多指正. 如果有朋友对此感兴趣,可以加入我:https://github.com/feiyun0112/machinelearning-samples.zh-cn 出租车费预测 ML.NET 版本 API 类型 状态 应用程序类型 数据类型 场景 机器学习任务 算法 v0.7 动态 API 最新版本 控制台应用程序 .csv 文件 价格预测 回归 Sdca 回归 在这个介绍性示例中,您…
随着谷歌,Facebook发布他们的工具机器学习工具Tensorflow 2和PyTorch ,微软的CNTK 2.7之后不再继续更新(https://docs.microsoft.com/zh-cn/cognitive-toolkit/releasenotes/cntk_2_7_release_notes),Build 2019 微软也发布了ML.NET 1.0 ,这是一个面向机器学习开发者的新框架.可以说2019年是机器学习社区普及化的一年,所有的这些发布清楚地表明了IT行业的发展方向.从数…
ML.NET是面向.NET开发人员的跨平台机器学习框架,而Model Builder是Visual Studio中的UI工具,它使用自动机器学习(AutoML)轻松地允许您训练和使用自定义ML.NET模型.借助ML.NET和Model Builder,您可以在没有任何机器学习经验的情况下为情绪分析,价格预测等场景创建自定义机器学习模型! ML.NET Model Builder 此版本的Model Builder带有bug修复和两个令人兴奋的新功能: 图像分类方案–使用您自己的图像在本地训练图像…
  在人工智能领域,无论是机器学习,还是深度学习等,Python编程语言都是绝对的主流,尽管底层都是C++实现的,似乎人工智能和C#/F#编程语言没什么关系.在人工智能的工程实现,通常都是将Python训练好的人工智能模型封装为REST API,以供其它的系统调用.虽然C#也确实天生就不合适搞人工智能的训练等,但是通过ML.NET这个开放源代码的跨平台机器学习框架,可以很容易的将人工智能集成到Web.移动.桌面.游戏和物联网应用中.这篇文章主要总结ML.NET的相关学习资源. 一.ML.NET模…