众所周知,faster-RCNN有两个主要部分:一是区域提议网络(RPN),另一个是fast-RCNN。
我的问题是,既然区域提议网络(RPN)可以输出类别分数和边界框并且可以训练,为什么我们需要 Fast-RCNN?
我是否认为 RPN 足以进行检测(红圈),而 Fast-RCNN 现在变得多余(蓝圈)?
最佳答案
简短的回答:不,它们并不多余。 R-CNN 文章及其变体普及了我们过去所说的级联的使用。 当时,对于检测来说,使用结构非常相似的不同检测器进行检测是相当普遍的,因为它们的能力互补。
如果检测部分正交,则可以消除误报。
此外,根据定义,R-CNN 的两个部分都有不同的作用,第一个部分用于区分对象与背景,第二部分用于区分对象的细粒度类别与其本身(以及背景)。
但是,如果只有 1 个类与背景,则可以仅使用 RPN 部分进行检测,但即使在这种情况下,链接两个不同的分类器可能会得到更好的结果(或者看不到例如 this article )
PS:我回答是因为我想回答,但这个问题绝对不适合 stackoverflow
关于machine-learning - Faster-RCNN,为什么我们不只使用 RPN 进行检测呢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41976254/