一些对象检测框架,例如 SSD(单次多盒检测器)和 Faster-RCNN,具有用于分类和回归的“卷积过滤器”。以下来自SSD:
For a feature layer of size m × n with p channels, the basic element for predicting parameters of a potential detection is a 3 × 3 × p small kernel that produces either a score for a category, or a shape offset relative to the default box coordinates. At each of the m × n locations where the kernel is applied, it produces an output value.
我的问题是:“小内核”的数量必须是 p 吗?设置一个任意数 k(与特征 channel 不同)如何?
最佳答案
图中,部分extra Feature layers
显示如何 small kernel
摘录p
来自每个输出位置的向量,预测不同 aspect ratios
的检测和 class categories
.
例如,从第一个卷积特征图,p 是 (3x(classes+4))
,第二个是 (6x(classes+4))
.号码 3
和 6
表示anchor
的数量为这些特征图定义的框,对于每个 anchor 框都有 classes + 4 box coordinates
输出。
所以你需要修复p
根据您为每个特征图决定的 anchor 框数量,您想要检测的类数量。
My question is: does the numbers of “small kernels” have to be p? How about set a arbitrary number k (which is not same with feature channels)?
特征 channel 是
3x3xp
卷积的结果channel 所以它总是需要大小 p ,它是内核的输出 channel 大小。并注意 3x3xp
实际上是 3 x 3 x in_channels x p
,例如第一个特征层是通过卷积38x38x512
得到的来自带有内核的 VGG 3x3x512xp
获取 38x38xp
关于deep-learning - 为什么过滤器和特征层具有相同数量的 channel ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50615786/