miou

1. 前言

本文学习记录了机器学习中的分类常见评价指标以及分割中的MIoU。
主要有以下概念：Accuracy， Precision， Recall， Fscore，混淆矩阵，IoU及MIoU。

2. 分类评测指标

图像分类，顾名思义就是一个模式分类问题，它的目标是将不同的图像，划分到不同的类别，实现最小的分类误差，这里我们只考虑单标签分类问题，即每一个图片都有唯一的类别。
对于单个标签分类的问题，评价指标主要有 Accuracy， Precision， Recall， Fscore。
在计算这些指标之前，我们先计算几个基本指标，这些指标是基于二分类的任务，也可以拓展到多分类。
- 标签为正样本，分类为正样本的数目为 True Positive，简称 TP。
- 标签为正样本，分类为负样本的数目为 False Negative，简称 FN。
- 标签为负样本，分类为正样本的数目为 False Positive，简称 FP。
- 标签为负样本，分类为负样本的数目为True Negative，简称 TN。
判别是否为正例只需要设一个概率阈值 T，预测概率大于阈值 T 的为正类，小于阈值 T 的为负类，默认就是 0.5。如果我们减小这个阀值 T，更多的样本会被识别为正类，这样可以提高正类的召回率，但同时也会带来更多的负类被错分为正类。如果增加阈值 T，则正类的召回率降低，精度增加。如果是多类，比如 ImageNet1000 分类比赛中的 1000 类，预测类别就是预测概率最大的那一类。

2.1 准确率 Accuracy

单标签分类任务中每一个样本都只有一个确定的类别，预测到该类别就是分类正确，没有预测到就是分类错误，因此最直观的指标就是 Accuracy，也就是准确率。
Accuracy=(TP+TN)/(TP+FP+TN+FN)，表示的就是所有样本都正确分类的概率，可以使用不同的阈值 T。
在 ImageNet 中使用的 Accuracy 指标包括 Top_1 Accuracy 和 Top_5 Accuracy， Top_1 Accuracy 就是前面计算的 Accuracy。
记样本 xi 的类别为 yi，类别种类为(0,1,…,C)，预测类别函数为 f，则 Top-1 的计算方法如下：

Top1−Acc=∑N−1i=0(f(xi)==yi)NTop⁡1−Acc=∑i=0N−1(f(xi)==yi)N

如果给出概率最大的 5 个预测类别，只要包含真实的类别，则判定预测正确，计算出来的指标就是 Top-5。

2.2 精确度 Precision 和召回率 Recall

正样本精确率为：Precision=TP/(TP+FP)，表示召回为正样本的样本中，到底有多少是真正的正样本。
正样本召回率为：Recall=TP/(TP+FN)，，表示的是有多少样本被召回类。

2.3 F1 score

有的时候我们不仅关注正样本的准确率，也关心其召回率，但是又不想用 Accuracy 来进行衡量，一个折中的指标是采用 F-score。
F1 score=2x Precision x Recall / (Precision+Recall)，只有在召回率 Recall 和精确率 Precision 都高的情况下，F1 score 才会很高，因此 F1 score 是一个综合性能的指标。

2.4 混淆矩阵

如果对于每一类，我们想知道类别之间相互误分的情况，查看是否有特定的类别之间相互混淆，就可以用混淆矩阵画出分类的详细预测结果。对于包含多个类别的任务，混淆矩阵很清晰的反映出各类别之间的错分概率，如下。

这是一个包含 20 个类别的分类任务，混淆矩阵为 20 x 20 的矩阵，其中第 i 行第 j 列，表示第 i 类目标被分类为第 j 类的概率，可以知道，越好的分类器对角线上的值更大，其他地方应该越小。

3. 分割评价指标

3.1 IoU

IoU 全称 Intersection-over-Union，即交并比，在目标检测领域中，定义为两个矩形框面积的交集和并集的比值， IoU=A∩B/A∪B。

如果完全重叠，则 IoU 等于 1，是最理想的情况。一般在检测任务中，IoU 大于等于 0.5 就认为召回，如果设置更高的 IoU 阈值，则召回率下降，同时定位框也越更加精确。
在图像分割中也会经常使用 IoU，此时就不必限定为两个矩形框的面积。比如对于二分类的前背景分割，那么 IoU=(真实前景像素面积∩预测前景像素面积)/(真实前景像素面积∪预测前景像素面积)，这一个指标，通常比直接计算每一个像素的分类正确概率要低，也对错误分类更加敏感。

3.2 精确度

假设共有k类（$L0-L_k，其中包含背景），，其中包含背景），p{ij}表示原本是i类但预测为j类的结果数。表示原本是i类但预测为j类的结果数。p{ii}$表示真正的结果数。而$p{ij}和和p_{ji}$分别被解释为假正和假负，尽管两者都是假正与假负之和。
Pixel Accuracy：标记正确的像素占总像素的比例

PA=∑ki=0pii∑ki=0∑kj=0pijPA=∑i=0kpii∑i=0k∑j=0kpij
Mean Pixel Accuracy：PA的平均值

MPA=1k∑i=0kpii∑kj=0pijMPA=1k∑i=0kpii∑j=0kpij

MIoU：均交并比，语义分割的标准度量。计算两个集合的交集与并集之比，在语义分割中，这两个集合为真实值和预测值。这个比例可以理解为：真正数/真正+假负+假正。

MIoU=1k∑i=0kpii∑kj=0pij+∑kj=0pji−piiMIoU=1k∑i=0kpii∑j=0kpij+∑j=0kpji−pii

等价于

MIoU=1k∑i=0kTPTP+FP+FNMIoU=1k∑i=0kTPTP+FP+FN
直观理解如下图：

3.3 上述指标的计算

首先得得出混淆矩阵，例如：

对于上例，MIoU的解释：
- 对于类别1：TP=43，FN=7，FP=2；
- 类别2：TP=45，FN=5，FP=6；
- 类别3：TP=49，FN=1，FP=5.
- 因此：IoU1=43/(43+2+7)=82.69%，IoU2=45/(45+5+6)=80.36%，IoU=49/(49+1+5)=89.09%
- 因此mIoU=84.05%，其实就是IOU的分母计算为矩阵的每一行加每一列，再减去重复的TP。
根据上述公式，代码如下：

miou的更多相关文章

DeeplabV3+ 命令行不显示miou的解决
首先看到训练时会在命令行里输出 loss 和 total loss,那是怎么做到的呢,通过分析 train.py 源码,看到如下代码 total_loss = tf.cond( should_log, ...
mIoU混淆矩阵生成函数代码详解
代码参考博客原文: https://blog.csdn.net/jiongnima/article/details/84750819 在原文和原文的引用里,找到了关于mIoU详尽的解释.这里重点解析 ...
目标检测的评价指标（TP、TN、FP、FN、Precision、Recall、IoU、mIoU、AP、mAP）
1. TP TN FP FN GroundTruth 预测结果 TP(True Positives): 真的正样本 = [正样本被正确分为正样本] TN(True Negatives): 真的 ...
详解计算miou的代码以及混淆矩阵的意义
详解计算miou的代码以及混淆矩阵的意义 miou的定义 ''' Mean Intersection over Union(MIoU,均交并比):为语义分割的标准度量.其计算两个集合的交集和并集之比. ...
LeetCode : 223. Rectangle Area
aaarticlea/png;base64,iVBORw0KGgoAAAANSUhEUgAABRQAAAQ0CAYAAAAPPZBqAAAMFGlDQ1BJQ0MgUHJvZmlsZQAASImVlw
论文笔记（7）：Constrained Convolutional Neural Networks for Weakly Supervised Segmentation
UC Berkeley的Deepak Pathak 使用了一个具有图像级别标记的训练数据来做弱监督学习.训练数据中只给出图像中包含某种物体,但是没有其位置信息和所包含的像素信息.该文章的方法将imag ...
论文笔记（6）：Weakly-and Semi-Supervised Learning of a Deep Convolutional Network for Semantic Image Segmentation
这篇文章的主要贡献点在于: 1.实验证明仅仅利用图像整体的弱标签很难训练出很好的分割模型: 2.可以利用bounding box来进行训练,并且得到了较好的结果,这样可以代替用pixel-level训 ...
理解图像分割中的卷积（Understand Convolution for Semantic Segmentation）
以最佳的101 layer的ResNet-DUC为基础,添加HDC,实验探究了几种变体: 无扩张卷积(no dilation):对于所有包含扩张卷积,设置r=1r=1 扩张卷积(dilation Co ...
SegNet 理解与文章结构
SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation 发表于2016年,作者 Vijay B ...
DeeplabV3+ 训练自己的遥感数据
一.预处理数据部分 1.创建 tfrecord(修改 deeplab\ dateasets\ build_data.py) 模型本身是把一张张 jpg 和 png 格式图片读到一个 Example 里 ...

随机推荐

看到项目中的DateTimeFormat和JsonFormat就头大
刚来这家公司的时候, 发现很多同事还在用这种方式写代码当时以为是偶然, 刚才在群里发现还有好多人在交流应当加哪些注解, 声明时区问题. 当写一个东西感到麻烦的时候, 那么大概率是有低成本的更优解的 ...
12-K8S之调度器、预选策略和优选函数
目录调度器.预选策略和优选函数 1.nodeSelector nodeName调度: 2.节点亲和性调度(pod亲和于node节点) 3.pod亲和度调度(pod亲和于pod) 4.pod反亲和性度 ...
wpf treeview 新增右键菜单
<TreeView.ItemContainerStyle> <Style TargetType="{x:Type TreeViewItem}"> <E ...
大规模并行处理器编程实战_原书第2版_pdf
链接:https://pan.baidu.com/s/1c8ez8dCTz5bUQchwhXAF7w 提取码:tc1f
SparkRDD所有算子操作，建议全部手敲一遍
说明: 1.以下方法全部来自这个RDD.scala,可以自己看源码 2.使用$SPARK_HOME/bin/spark-shell运行代码 3.注释部分是运行结果 //org.apache.spark ...
yarn 安装全局包
yarn 安装全局包,无法使用,需要添加yarn的bin文件夹到环境变量然后重启一下即可使用,再装其他全局包也可直接使用
vvv,具名插槽
<!DOCTYPE html> <html> <head> <script src="a.js"></script> & ...
Python学习笔记组织文件之shutil模块
随笔记录方便自己和同路人查阅. #------------------------------------------------我是可耻的分割线--------------------------- ...
tomcat多主多备
主服务器默认轮询,当主服务器全部挂了,就会访问备机backup,备机也默认轮询
redis info 对应参数详解
https://blog.csdn.net/qq_27342265/article/details/123094422 info命令的使用方法有以下三种: info:部分Redis系统状态统计信息.i ...

miou

1. 前言

2. 分类评测指标

2.1 准确率 Accuracy

2.2 精确度 Precision 和召回率 Recall

2.3 F1 score

2.4 混淆矩阵

3. 分割评价指标

3.1 IoU

3.2 精确度

3.3 上述指标的计算

miou的更多相关文章

随机推荐

热门专题