machine-learning - 什么是 mAP 指标以及它是如何计算的?

原文 标签 machine-learning computer-vision detection metrics vision

关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。












想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。

6 个月前关闭。



Improve this question




在计算机视觉和物体检测中,常用的评价方法是mAP。
它是什么以及它是如何计算的?

最佳答案

报价来自上述Zisserman paper - 4.2 Evaluation of Results (Page 11) :

首先,“重叠标准”被定义为大于 0.5 的交集与联合。 (例如,如果预测框相对于真实框满足此标准,则将其视为检测)。然后使用这种“贪婪”方法在 GT 框和预测框之间进行匹配:

Detections output by a method were assigned to ground truth objects satisfying the overlap criterion in order ranked by the (decreasing) confidence output. Multiple detections of the same object in an image were considered false detections e.g. 5 detections of a single object counted as 1 correct detection and 4 false detections



因此,每个预测框要么是 True-Positive,要么是 False-Positive。
每个ground-truth框都是True-Positive。
没有真负。

然后通过平均精度-召回曲线上的精度值来计算平均精度,其中召回率在 [0, 0.1, ..., 1] 范围内(例如 11 个精度值的平均值)。更准确地说,我们考虑稍微修正的 PR 曲线,其中对于每个曲线点 (p, r),如果存在不同的曲线点 (p', r') 使得 p' > p 且 r' >= r ,我们用这些点的最大 p' 替换 p。

我仍然不清楚的是那些 的 GT 盒子做了什么。从不检测到(即使置信度为 0)。这意味着某些召回值是精度-召回曲线永远不会达到的,这使得上面的平均精度计算未定义。

编辑:

简短回答:在召回率无法达到的区域,精度下降到 0。

解释这一点的一种方法是假设当置信度阈值接近 0 时, 的数量是无限的。预测 边界框点亮整个图像。然后精度立即变为 0(因为只有有限数量的 GT 框)并且召回率在这条平坦曲线上不断增长,直到我们达到 100%。

关于machine-learning - 什么是 mAP 指标以及它是如何计算的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36274638/

相关文章:

opencv - SimpleBlobDetector 无法识别更明显的圆圈

java - Java中的距离度量

machine-learning - 线性偏差非常接近零

Python Opencv2 : Background appearing on a no background image after adding it on webcam frame

来自两个不同角度的两个视频文件的 3D 场景

javascript - 捕获按键以过滤元素

python - 如何使虚拟生物学习使用神经网络?

tensorflow - 多类分类问题中的不平衡类

python - Tensorflow Slim : TypeError: Expected int32, 得到了包含类型为 '_Message' 的张量的列表

php - 使用 PHP 监控外部 ftp 上传