机器学习ML策略

1、为什么是ML策略

例如：识别cat分类器的识别率是90%，怎么进一步提高识别率呢？

想法：

（1）收集更多数据

（2）收集更多的多样性训练样本

（3）使用梯度下降训练更长时间

（4）尝试Adam代替梯度下降

（5）尝试更大的网络

（6）尝试更小的网络

（7）尝试dropout

（8）尝试L2正则化

（9）修改网络架构（激励函数，隐含层单元数目）

2、正交化

正交化（正交性）是一种系统设计属性，它可以确保修改算法的一个指令或者组成部分将不会对系统的其他组成部分产生或者传播副作用。使得核查算法变得容易，减少测试和开发算法的时间。

一个好的机器学习算法按算法流程需要满足（正交化）：

（1）在训练集中表现好（接近人类）。如果不好，可换大型网络或者更换优化算法

（2）在验证集中表现好。如果不好，可尝试正则化或者使用大一点规模的训练集

（3）在测试集中表现好。如果不好，可尝试大一点的验证集

（4）在真实世界中表现好。如果不好，测试集不正确或者代价函数有问题

3、单一数字评估指标

混淆矩阵：

True Positive（TP）：正类预测为正类

True Negtive（TN）：负类预测为负类

False Positive（FP）：负类预测为正类（误报）

False Negative（FN）：正类预测为负类（漏报）

	Positive	Negative
True	TP	TN
False	FP	FN

精确率（precision）：针对预测结果而言的，它表示的是预测为正的样本中有多少是对的

P = TP/（TP+FP）

准确率（accuracy）：ACC = （TP+TN）/（TP+TN+FP+FN）

召回率（recall）：针对我们原来的样本而言的，它表示的是样本中的正例有多少被预测正确的

R = TP/（TP+FN）

F1值：2/F1 = 1/P +1/R ---> F1 = 2TP/（2TP+FP+FN）

在信息检索领域，精确率和召回率又被称为查准率和查全率，

查准率＝检索出的相关信息量 / 检索出的信息总量

查全率＝检索出的相关信息量 / 系统中的相关信息总量

机器学习ML策略的更多相关文章

[机器学习] ML重要概念：梯度（Gradient）与梯度下降法（Gradient Descent）
引言机器学习栏目记录我在学习Machine Learning过程的一些心得笔记,涵盖线性回归.逻辑回归.Softmax回归.神经网络和SVM等等,主要学习资料来自网上的免费课程和一些经典书籍,免费课 ...
机器学习 - ML
CNCC - 2016 | 机器学习(原文链接) Machine Learning - ML,机器学习起源于人工智能,是AI的一个分支. 机器学习的理论基础:计算学习理论 - Computationa ...
机器学习 ML.NET 发布 1.0 RC
ML.NET 是面向.NET开发人员的开源和跨平台机器学习框架(Windows,Linux,macOS),通过使用ML.NET,.NET开发人员可以利用他们现有的工具和技能组,为情感分析,推荐,图像分 ...
机器学习 - ML + 深度学习 - DL
机器学习 CNCC - 2016 | 机器学习(原文链接) Machine Learning - ML,机器学习起源于人工智能,是AI的一个分支. 机器学习的理论基础:计算学习理论 - Computa ...
.NET机器学习 ML.NET 1.4预览版和模型生成器更新
ML.NET 是面向.NET开发人员的开源和跨平台机器学习框架. ML.NET 还包括Model Builder (一个简单的UI工具)和 CLI ,使用自动机器学习(AutoML)构建自定义 ...
认识：人工智能AI 机器学习 ML 深度学习DL
人工智能人工智能(Artificial Intelligence),英文缩写为AI.它是研究.开发用于模拟.延伸和扩展人的智能的理论.方法.技术及应用系统的一门新的技术科学. 人工智能是对人的意识. ...
PCB 机器学习(ML.NET)初体验实现PCB加投率预测
使用ML.NET建立PCB加投率模型对单一蚀刻工序进行加投率预测, 此实例为最简单预测,要想实现全流程加投率预测挑战难度还是挺大的,可以查看另一种关于大数据在PCB行业应用---加投率计算基本原理:P ...
吴恩达《深度学习》-第三门课结构化机器学习项目（Structuring Machine Learning Projects）-第一周机器学习（ML）策略（1）（ML strategy（1））-课程笔记
第一周机器学习(ML)策略(1)(ML strategy(1)) 1.1 为什么是 ML 策略?(Why ML Strategy?) 希望在这门课程中,可以教给一些策略,一些分析机器学习问题的方法, ...
DeepLearning.ai学习笔记（三）结构化机器学习项目--week1 机器学习策略
一.为什么是ML策略如上图示,假如我们在构建一个喵咪分类器,数据集就是上面几个图,训练之后准确率达到90%.虽然看起来挺高的,但是这显然并不具一般性,因为数据集太少了.那么此时可以想到的ML策略有哪 ...

随机推荐

Python3基础 response.read 输出网页的源代码
Python : 3.7.0 OS : Ubuntu 18.04.1 LTS IDE : PyCharm 2018.2.4 Conda ...
P2042 [NOI2005]维护数列
思路超级恶心的pushdown 昏天黑地的调让我想起了我那前几个月的线段树2 错误这恶心的一道题终于过了太多错误,简直说不过来 pushup pushdown 主要就是这俩不太清晰,乱push ...
cat查看文件以及sed查看指定行数
https://unix.stackexchange.com/questions/288521/with-the-linux-cat-command-how-do-i-show-only-certai ...
Baseline
Baseline Baselines an existing database, excluding all migrations upto and including baselineVersion ...
P3167 [CQOI2014]通配符匹配
吐槽本来是去写AC自动机的,然后发现数据范围每个串100000,有100个串(???),连塞进trie树里都塞不进去,玩个鬼的AC自动机啊,tag不要乱打啊最后拿字符串hash+爆搜一发搜过去了. ...
Latex: "Missing $ inserted" 解决方法
参考: Latex报"Missing $ inserted"的解决方法 Latex: "Missing $ inserted" 解决方法原因一:在文中出现&q ...
Linux命令之nl命令
nl 命令在 Linux 系统中用来计算文件中行号.nl 可以将输出的文件内容自动的加上行号,其默认的结果和与 cat -n 有点不太一样,nl 可以将行号做比较多的显示设计,包括位数是否自动补齐 ...
Win10远程桌面可能是由于CredSSP加密Oracle修正
win10更新1083之后,远程桌面就会连接失败,显示如下: 根据微软官方的说法是更改了安全策略: https://support.microsoft.com/zh-cn/help/4093492/c ...
JavaScript中 call和apply
call()方法和apply()方法的作用相同,他们的区别在于接收参数的方式不同. 对于call(),第一个参数是this值没有变化,变化的是其余参数都直接传递给函数.(在使用call()方法时,传递 ...
git core.autocrlf配置解决Windows和Linux（Mac）换行问题
格式化格式化是许多开发人员在协作时,特别是在跨平台情况下,遇到的令人头疼的细小问题. 由于编辑器的不同或者Windows程序员在跨平台项目中的文件行尾加入了回车换行符, 一些细微的空格变化会不经意地 ...

机器学习ML策略

机器学习ML策略的更多相关文章

随机推荐

热门专题