machine-learning - Faster-RCNN,为什么我们不只使用 RPN 进行检测呢?

标签 machine-learning computer-vision object-detection

众所周知,faster-RCNN有两个主要部分:一是区域提议网络(RPN),另一个是fast-RCNN。

我的问题是,既然区域提议网络(RPN)可以输出类别分数和边界框并且可以训练,为什么我们需要 Fast-RCNN?

我是否认为 RPN 足以进行检测(红圈),而 Fast-RCNN 现在变得多余(蓝圈)?

enter image description here

最佳答案

简短的回答:不,它们并不多余。 R-CNN 文章及其变体普及了我们过去所说的级联的使用。 当时,对于检测来说,使用结构非常相似的不同检测器进行检测是相当普遍的,因为它们的能力互补。

如果检测部分正交,则可以消除误报。

此外,根据定义,R-CNN 的两个部分都有不同的作用,第一个部分用于区分对象与背景,第二部分用于区分对象的细粒度类别与其本身(以及背景)。

但是,如果只有 1 个类与背景,则可以仅使用 RPN 部分进行检测,但即使在这种情况下,链接两个不同的分类器可能会得到更好的结果(或者看不到例如 this article )

PS:我回答是因为我想回答,但这个问题绝对不适合 stackoverflow

关于machine-learning - Faster-RCNN,为什么我们不只使用 RPN 进行检测呢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41976254/

相关文章:

image-processing - Caffe的卷积层中bias_filler类型 "constant"的默认值是多少?

tensorflow - tensorflow 对象检测训练中的标签文件

python - SciKit Learn 中的多类逻辑回归

machine-learning - one-hot 编码是否会导致功能不平衡的问题?

opencv - 相机和投影仪校准

python - OpenCV:如何使用cv2.CascadeClassifier获得功能?

python - 如何从保存的模型(SSD MobileNet)创建 tflite 文件

java - 如何为 spark mllib kmeans 聚类算法格式化数据?

machine-learning - 损失函数如何知道在 PyTorch 中为哪个模型计算梯度?

python - 扫描文本表格的图像配准