机器学习评价方法 - Recall & Precision

刚开始看这方面论文的时候对于各种评价方法特别困惑，还总是记混，不完全统计下，备忘。

关于召回率和精确率，假设二分类问题，正样本为x，负样本为o：

准确率存在的问题是当正负样本数量不均衡的时候：

精心设计的分类器最后算准确率还不如直接预测所有的都是正样本。

用Recall和Precision来衡量分类效果，可以使用F1 Score = 2PR/(P+R)来判断分类效果。

调整分类器，移动到这里：

Recall达到百分之一百，但同时Precision也下降了：把不是负样本也分类成了正样本。一般来说，R高，P低，或者R低，P高。大概长这样：

从这里偷来的图

一个好的分类方法当然是希望二者都尽量高，也就是右图红色线那样，所以提出又提出了一个衡量标准：mAP=∫P(R)dR,（PR曲线面积越大越好）。

当然不同应用有不同需求，还是要根据具体应用设计。

记得微软ECCV14的人脸检测就是先用OpenCV里的VJ方法，把Recall调得很高，尽量保证不漏检，同时带来的问题是Precision很低，有很多不是脸的东西，再通过3000帧人脸对齐方法，迭代几次，一边对齐人脸一边把不是脸的排除掉。

另外还有 ROC AUC及其他各种......

ROC和AUC也是针对正负样本数量不均衡的，参考这里

ROC曲线越靠近左上角,试验的准确性就越高。最靠近左上角的ROC曲线的点是错误最少的最好阈值，其假阳性和假阴性的总数最少。亦可通过分别计算各个试验的ROC曲线下的面积(AUC)进行比较，哪一种试验的 AUC最大，则哪一种试验的诊断价值最佳。

kISSME（cvpr12）里的ROC曲线：

关于Precision和Recall，在Ng的cousera课程 week6 lecture11里有

机器学习评价方法 - Recall & Precision的更多相关文章

机器学习classification_report方法及precision精确率和recall召回率说明
classification_report简介 sklearn中的classification_report函数用于显示主要分类指标的文本报告．在报告中显示每个类的精确度,召回率,F1值等信息. 主要 ...
目标检测的评价标准mAP, Precision, Recall, Accuracy
目录 metrics 评价方法 TP , FP , TN , FN 概念计算流程 Accuracy , Precision ,Recall Average Precision PR曲线 AP计算 A ...
机器学习 F1-Score, recall, precision
在机器学习,模式识别中,我们做分类的时候,会用到一些指标来评判算法的优劣,最常用的就是识别率,简单来说,就是 Acc=Npre/Ntotal 这里的 Npre表示预测对的样本数,Ntotal表示测试集 ...
图像质量评价方法PSNR+SSIM&&评估指标SROCC,PLCC
update:2018-04-07 今天发现ssim的计算里面有高斯模糊,为了快速计算,先对每个小块进行计算,然后计算所有块的平均值.可以参考源代码实现,而且代码实现有近似的在里面!matlab中中图 ...
Spark Mllib里决策树二元分类使用.areaUnderROC方法计算出以AUC来评估模型的准确率和决策树多元分类使用.precision方法以precision来评估模型的准确率（图文详解）
不多说,直接上干货! Spark Mllib里决策树二元分类使用.areaUnderROC方法计算出以AUC来评估模型的准确率具体,见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的 ...
多准则决策模型-TOPSIS评价方法-源码
? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 ...
自动文档摘要评价方法：Edmundson，ROUGE
自动文档摘要评价方法大致分为两类: (1)内部评价方法(Intrinsic Methods):提供参考摘要,以参考摘要为基准评价系统摘要的质量.系统摘要与参考摘要越吻合, 质量越高. (2)外部评价方 ...
全参考视频质量评价方法（PSNR，SSIM）以及与MOS转换模型
转载处:http://blog.csdn.NET/leixiaohua1020/article/details/11694369 最常用的全参考视频质量评价方法有以下2种: PSNR(峰值信噪比):用 ...
视频质量评价方法：VQM
如何确定一个视频质量的好坏一直以来都是个棘手的问题.目前常用的方法就是通过人眼来直接观看,但是由于人眼的主观性及观看人员的单体差异性,对于同样的视频质量,不同的人的感受是不一样的.为此多个研究机构提出 ...

随机推荐

ELKstack5.6.5
ELKstack 安装: 一:环境准备: 1.给添加块磁盘50G,相当于模拟raid 2.分别给它们做本机的主机解析 [root@node01 ~ ]#cat /etc/hosts 127.0.0. ...
【Loadrunner】Loadrunner 手动关联技术
Loadrunner 手动关联技术录制成功,回放失败,怀疑和动态数据有关: 1 重新录制一份脚本,两次录制的脚本进行比对,确定动态数据,复制动态数据: 2 找到第一次产生该动态数据的响应对应的相应 ...
（4.25）格式化T-SQL工具
写代码的一个重要方面是格式化.没有人喜欢格式错误的代码.对于继承它的人,甚至是作者,他/她在一周左右后检查它是很难理解/维护的我确实理解开发人员在严格的交付准则下工作,没有人会想要延迟交付,而不是格 ...
Sql server 2016 Always On 搭建Windows集群配置
.安装WSFC群集组件 1)打开服务器管理器,选择“功能”,在右边窗口中点击“添加功能”. 2)在添加功能向导中,勾选“故障转移群集”,点击“下一步”. 3)在“确认安装选择”页面中,点击“安装”,进 ...
RN-TextInput组件去掉下划线
<View style={styles.container}> <TextInput style={styles.textInputStyle} underlineColorAndr ...
Python 全栈开发二 python基础字符串字典集合
一.字符串 1,在python中,字符串是最为常见的数据类型,一般情况下用引号来创建字符串. >>ch = "wallace" >>ch1 = 'walla ...
java编写的Http协议的多线程下载器
断点下载器还在实现中...... //////////////////////////////////界面/////////////////////////////////////////// pac ...
Groovy动态解析
A:前面需要说些什么吗? B:不需要吗? A:需要吗? 解析方式一:通过指定的paths来初始化GroovyScriptEngine //通过指定的paths来初始化GroovyScriptEngin ...
pd.concat/merge/join
pandas的拼接分为两种: 级联:pd.concat, pd.append 合并:pd.merge, pd.join 一.回顾numpy.concatenate 生成1个6*3的矩阵,一个2*3的矩 ...
cocos2d-x C++ 判断当前平台宏定义大全
/**************************************************************************** Copyright (c) 2010-201 ...

机器学习评价方法 - Recall & Precision

机器学习评价方法 - Recall & Precision的更多相关文章

随机推荐

热门专题