关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。
想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。
6 个月前关闭。
Improve this question
在计算机视觉和物体检测中,常用的评价方法是mAP。
它是什么以及它是如何计算的?
最佳答案
报价来自上述Zisserman paper - 4.2 Evaluation of Results (Page 11) :
首先,“重叠标准”被定义为大于 0.5 的交集与联合。 (例如,如果预测框相对于真实框满足此标准,则将其视为检测)。然后使用这种“贪婪”方法在 GT 框和预测框之间进行匹配:
Detections output by a method were assigned to ground truth objects satisfying the overlap criterion in order ranked by the (decreasing) confidence output. Multiple detections of the same object in an image were considered false detections e.g. 5 detections of a single object counted as 1 correct detection and 4 false detections
因此,每个预测框要么是 True-Positive,要么是 False-Positive。
每个ground-truth框都是True-Positive。
没有真负。
然后通过平均精度-召回曲线上的精度值来计算平均精度,其中召回率在 [0, 0.1, ..., 1] 范围内(例如 11 个精度值的平均值)。更准确地说,我们考虑稍微修正的 PR 曲线,其中对于每个曲线点 (p, r),如果存在不同的曲线点 (p', r') 使得 p' > p 且 r' >= r ,我们用这些点的最大 p' 替换 p。
我仍然不清楚的是那些 的 GT 盒子做了什么。从不检测到(即使置信度为 0)。这意味着某些召回值是精度-召回曲线永远不会达到的,这使得上面的平均精度计算未定义。
编辑:
简短回答:在召回率无法达到的区域,精度下降到 0。
解释这一点的一种方法是假设当置信度阈值接近 0 时, 的数量是无限的。预测 边界框点亮整个图像。然后精度立即变为 0(因为只有有限数量的 GT 框)并且召回率在这条平坦曲线上不断增长,直到我们达到 100%。
关于machine-learning - 什么是 mAP 指标以及它是如何计算的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36274638/