ML.net重新训练模型需要注意的事项。
ml.net是微软机器学习的东西,如果你的需求是需要一个固定的模型来进行操作的话那就按着官网的教程来就可以,但是大部分的模型可能不满足现有的需求,那么我们需要对模型进行重新训练。
重新训练模型有限制条件,你重新训练模型的数据分类必须是原有模型已有的分类,如果想增加分类的话只能重新训练一个新的模型来进行操作。
模型重新训练的话在第一次模型生成时候需要保存另外一个模型文件,如图:
modle的生成是通过定义的ogdEstimator算法进行生成的,而ogdEstimator里的算法需要和上面你生成模型的管道的算法一致。算法所需要的参数labelColumnName和featureColumnName也需要一一对应。
第一次建模型阶段准备工作已完成,需要保存的两个zip尽量保存到项目中去。
后续训练已有的模型开始的话是这样的:
首先加载你所保存的两个模型文件,originalModelParameters所转换的参数类型需要跟你模型的算法参数类型匹配,不然会提示无法转换成功。
然后加载你导入的新数据,转为IDataview。
这部分是主要是重新训练模型的算法,LbfgsMaximumEntropy里面的参数要相对应,这个就不用说了,当然你的算法要是其他的也差不太多。
Fit所传入的两个变量,第一个是你的新数据,第二个是你的老数据,新的训练模型将以老数据为起点进行训练。
所生成的retrainedModel模型数据直接保存到modelZip就可以。
接下来在进行使用这个模型的时候需要进行一些改变。
如果你不需要重新训练模型的话,进行预测是这样的:
直接拿第一次生成的模型进行预测。然后返回给你预测的结果。
但是当我们重新训练过模型的时候需要对预测方法进行一些改变:
需要加载初始的模型和训练后的模型。
重新训练模型的正常流程大概就是这样的了。正常生成模型以及进行预测的方法官方的demo里就可以找到。
注:保存模型之后的Weights会获取不到,提示非公开成员。然后我这边需要进行这样一个操作:
先定义然后通过GetWeights获取Weights的数据。
ML.net重新训练模型需要注意的事项。的更多相关文章
- GitHub超全机器学习工程师成长路线图,开源两日收获3700+Star!【转】
作者 | 琥珀 出品 | AI科技大本营(ID:rgznai100) 近日,一个在 GitHub 上开源即收获了 3700+ Star 的项目,引起了营长的注意.据介绍,该项目以 TensorFlow ...
- [iOS笔试600题]二、常识篇(共有72题)
[B]1.NSObject是一个根类,几乎所有的类都是从它派生而来.但是根类并不拥有真它类都有的alloc和init方法?[判断题] A. 正确 B. 错误 [A]2. UIResponder可以让继 ...
- C#中的深度学习(五):在ML.NET中使用预训练模型进行硬币识别
在本系列的最后,我们将介绍另一种方法,即利用一个预先训练好的CNN来解决我们一直在研究的硬币识别问题. 在这里,我们看一下转移学习,调整预定义的CNN,并使用Model Builder训练我们的硬币识 ...
- [.NET6]使用ML.NET+ONNX预训练模型整活B站经典《华强买瓜》
最近在看微软开源的机器学习框架ML.NET使用别人的预训练模型(开放神经网络交换格式.onnx)来识别图像,然后逛github发现一个好玩的repo.决定整活一期博客. 首先还是稍微科普一下机器学习相 ...
- [Machine Learning & Algorithm]CAML机器学习系列1:深入浅出ML之Regression家族
声明:本博客整理自博友@zhouyong计算广告与机器学习-技术共享平台,尊重原创,欢迎感兴趣的博友查看原文. 符号定义 这里定义<深入浅出ML>系列中涉及到的公式符号,如无特殊说明,符号 ...
- ML(4): NavieBayes在R中的应用
朴素贝叶斯方法是一种使用先验概率去计算后验概率的方法, 具体见上一节. 算法包:e1071 函数:navieBayes(formule,data,laplace=0,...,subset,na.act ...
- Core ML 机器学习
在WWDC 2017开发者大会上,苹果宣布了一系列新的面向开发者的机器学习 API,包括面部识别的视觉 API.自然语言处理 API,这些 API 集成了苹果所谓的 Core ML 框架.Core M ...
- ML学习分享系列(2)_计算广告小窥[中]
原作:面包包包包包包 改动:寒小阳 && 龙心尘 时间:2016年2月 出处:http://blog.csdn.net/Breada/article/details/50697030 ...
- 使用TensorFlow Object Detection API+Google ML Engine训练自己的手掌识别器
上次使用Google ML Engine跑了一下TensorFlow Object Detection API中的Quick Start(http://www.cnblogs.com/take-fet ...
随机推荐
- D. Numbers on Tree(构造)【CF 1287】
传送门 思路: 我们需要抓住唯一的重要信息点"ci",我的做法也是在猜想和尝试中得出的,之后再验证算法的正确性. 我们在构造中发现,如果树上出现了相同的数字,则会让树的构造变得不清 ...
- 整理一下dedecms的相关知识
dedecms更改数据库连接 文件 data/common.inc.php ------------------------------------------------------------ ...
- Integer中的奇妙位运算
Integer中的奇妙位运算 参考资料 https://segmentfault.com/a/1190000015763941 highestOneBit(int i) 函数的作用是获得传入参数的最高 ...
- 技巧收藏|10个JavaScript常用数组操作方法
摘要:这篇文章,向大家展示了在日常开发中,数组有哪些小技巧值得借鉴和学习. 在web前端开发第二阶段Javascript中,数组是一个重要且常见的知识点,我们经常将数据存储在数组中,遍历数组或替换数组 ...
- java备份Oracle数据库表
<html><head><title>数据备份</title><meta name="decorator" content=& ...
- linux搭建harbor与使用
条件:安装docker&docker-compose 如未安装,请看:linux离线安装docker + docker-compose harbor 1.下载 下载地址:https://git ...
- PyQt(Python+Qt)学习随笔:图例解释QFrame类的lineWidth、midLineWidth以及frameWidth属性
老猿Python博文目录 老猿Python博客地址 QFrame类有四个跟宽度相关的属性,分别是width.lineWidth.midLineWidth以及frameWidth属性.width是整个Q ...
- ARL资产导出对接Xray扫描
使用ARL资产灯塔系统对目标进行资产整理的时候,能够对获取的结果进行导出: 导出之后为excel文件 想要将site中的URL导出为txt文件,再使用Xray高级版进行批量化扫描: https://w ...
- linux进程管理(linux命令安装、进程生命周期、进程状态)
1 linux下如何杀掉进程 1)找到包名所占用的端口: ps aux | grep cbs_portal-1.0.1.jar(包名) 2)杀掉进程: kill 10942(端口号) PS: //-- ...
- THE BUG 队第一次团队作业
1.队名: THE BUG 队 2.队员学号: 杨梓琦 3118005115(队长) 温海源,3118005109 陈杰才,3118005089 李华,3118005097 钟明康,311800512 ...