最常用的是查准率P（precision），查全率R（recall），F1

一、对于二分类问题

混淆矩阵（confusion matrix）：

	预测结果
真实情况	正例	反例
正例	TP，true positive,真正	FN，false negative 假反
反例	FP ，false positive,假正	TN，true negative 真反

$P = \frac{TP}{TP+FP}$ 查准率=真正 / (真正+假正) = predicted and true positive/ predicted positive

$R= \frac{TP}{TP+FN}$ 查全率= 真正 /(真正+假反) = predicted and true positive/ true positive

P , R是一对矛盾的度量，一般一个的值高了，另一个的值就会降低，

P-R图：

若学习器A的 P-R曲线将学习器B的 P-R曲线完全包住，则学习器A 在该问题上优于 B

若A B的P-R曲线有交叉，则比较P-R曲线下面积的大小，越大越好

平衡点 break even point BEP，是P==R 时的取值

F值度量：

$F1=\frac{2\times P\times R}{P+R}$ $F1=\frac{2\times TP}{n+TP-TN}$ ,n为样例总数

$F_{\beta }=\frac{(1+\beta^{2})\times P\times R}{(\beta^{2}\times P)+R}$ β>1，R有更大影响，β<1,P有更大影响

二、对于多分类问题

多分类问题，每两两类别组合，构成n个二分类问题，每个二分类问题对应一个混淆矩阵

1.macro

先在各个混淆矩阵上分别计算P,R, 再求平均得到宏查准率macro-P, 宏查全率macro-R,

基于宏查准率macro-P, 宏查全率macro-R,计算宏F1 macro-F1

$macro-P=\frac{1}{n}\sum_{i=1}^{n}P_i$ $macro-R=\frac{1}{n}\sum_{i=1}^{n}R_i$

$marco-F1=\frac{2\times macroP\times macroR}{marcoP+marcoR}$

2.micro

将各个混淆矩阵的对应元素进行平均，得到TP,FP,TN,FN的平均值： $\overline{TP} , \overline{FP}, \overline{TN}, \overline{FN}$

$micro-P=\frac{\overline{TP}}{\overline{TP}+\overline{FP}}$ $micro-R=\frac{\overline{TP}}{\overline{TP}+\overline{FN}}$

$micro-F1=\frac{2\times microP\times microR }{microP+microR}$

转载：https://blog.csdn.net/k411797905/article/details/89735604#%E6%9C%80%E5%B8%B8%E7%94%A8%E7%9A%84%E6%98%AF%E6%9F%A5%E5%87%86%E7%8E%87P%EF%BC%88precision%EF%BC%89%EF%BC%8C%E6%9F%A5%E5%85%A8%E7%8E%87R%EF%BC%88recall%EF%BC%89%EF%BC%8CF1

P,R,F1 等性能度量（二分类、多分类）的更多相关文章

【分类问题中模型的性能度量(二)】超强整理，超详细解析，一文彻底搞懂ROC、AUC
文章目录 1.背景 2.ROC曲线 2.1 ROC名称溯源(选看) 2.2 ROC曲线的绘制 3.AUC(Area Under ROC Curve) 3.1 AUC来历 3.2 AUC几何意义 3.3 ...
【分类问题中模型的性能度量(一)】错误率、精度、查准率、查全率、F1详细讲解
文章目录 1.错误率与精度 2.查准率.查全率与F1 2.1 查准率.查全率 2.2 P-R曲线(P.R到F1的思维过渡) 2.3 F1度量 2.4 扩展性能度量是用来衡量模型泛化能力的评价标准,错 ...
机器学习性能度量指标:ROC曲线、查准率、查全率、F1
错误率在常见的具体机器学习算法模型中,一般都使用错误率来优化loss function来保证模型达到最优. \[错误率=\frac{分类错误的样本}{样本总数}\] \[error=\frac{1} ...
吴裕雄 python 机器学习——模型选择分类问题性能度量
import numpy as np import matplotlib.pyplot as plt from sklearn.svm import SVC from sklearn.datasets ...
机器学习实战笔记(Python实现)-07-模型评估与分类性能度量
1.经验误差与过拟合通常我们把分类错误的样本数占样本总数的比例称为“错误率”(error rate),即如果在m个样本中有a个样本分类错误,则错误率E=a/m:相应的,1-a/m称为“精度”(acc ...
模型的性能评估(二) 用sklearn进行模型评估
在sklearn当中,可以在三个地方进行模型的评估 1:各个模型的均有提供的score方法来进行评估. 这种方法对于每一种学习器来说都是根据学习器本身的特点定制的,不可改变,这种方法比较简单.这种方法 ...
机器学习性能度量指标：AUC
在IJCAI 于2015年举办的竞赛:Repeat Buyers Prediction Competition 中, 很多参赛队伍在最终的Slides展示中都表示使用了 AUC 作为评估指标: ...
Python自然语言处理笔记【二】文本分类之监督式分类的细节问题
一.选择正确的特征 1.建立分类器的工作中如何选择相关特征,并且为其编码来表示这些特征是首要问题. 2.特征提取,要避免过拟合或者欠拟合过拟合,是提供的特征太多,使得算法高度依赖训练数据的特性,而对 ...
使用PerfView监测.NET程序性能（二）：Perfview的使用
在上一篇博客中,我们了解了对Windows及应用程序进行性能分析的基础:Event Trace for Windows (ETW).现在来看看基于ETW的性能分析工具——Perfview.exe Pe ...

随机推荐

[LeetCode] 71. Simplify Path 简化路径
Given an absolute path for a file (Unix-style), simplify it. For example,path = "/home/", ...
java面试（七）- 关于String
1 String的定义(Java8中) // final的类,不能被继承// 继承了序列化接口,comparable接口,public final class String implements ja ...
永久解决Sublime包管理package control 打开install package报错 There are no packages available for installation
很多用户在使用sumblime安装插件的时候,打开package control的install package会出现报错:There are no packages available for in ...
COGS 有标号的DAG/强连通图计数
COGS索引一堆神仙容斥+多项式-- 有标号的DAG计数 I 考虑$O(n^2)$做法:设$f_i$表示总共有$i$个点的DAG数量,转移考虑枚举DAG上所有出度为$0$的点,剩下的 ...
[高清·非影印]Spring实战+SpringBoot实战+Spring微服务实战+SpringCloud微服务实战(全4本)
------ 郑重声明 --------- 资源来自网络,纯粹共享交流, 如果喜欢,请您务必支持正版!! --------------------------------------------- 下 ...
AES不同语言加密解密
AES加密模式和填充方式:还有其他算法/模式/填充 16字节加密后数据长度不满16字节加密后长度 AES/CBC/NoPadding 16 不支持 AES/CBC/PKCS5Padding 32 ...
Java冒泡排序与快速排序笔记
public class Sort { public static void sort() { Scanner input = new Scanner(System.in); int sort[] = ...
java之servlet之文件下载
1.在页面中,可以直接通过超链接来下载: a) 如果浏览器能够打开该文件,那么直接在浏览器中显示---不是想要的效果 b) 任何人都能下载,不能进行权限控制 2.通过servlet来进行下载,在ser ...
js 简单的滑动4
js 简单的滑动教程(四) 作者:Lellansin 转载请标明出处,谢谢在大概的了解滑动的基本原理和怎么去实现之后,现在我们将更深入的去讨论js的滑动. 相信细心的朋友应该已经发现了,在本教程 ...
Mac 磁盘分区格式
Mac 磁盘分区格式来源 https://www.chadou.me/p/190 参考文章 macOS磁盘工具帮助在Mac系统中抹掉(格式化)磁盘的时候,要求选择分区方案,包括GUID分区图.主引 ...

P,R,F1 等性能度量（二分类、多分类）