所以有很多关于如何提取 HoG 特征的选择。
使用不同的方向、每个单元格的不同像素数和不同的块大小。
但是有标准或最佳配置吗?
我有大小为 50x100 的训练图像,我选择了 8 个方向。我正在从训练数据中提取特征以进行车辆分类。但我真的不知道什么是“最佳”。
例如,我这里有 2 种配置,是否有任何理由选择一种而不是另一种?我个人觉得第二个是更好的选择,但为什么呢?
最佳答案
我使用 HOG 进行产品识别。根据我当时的理解,您指的是标准 HOG 的一个真正问题。根本没有最佳配置,这取决于数据集。如果您有数据集的最佳值,然后调整数据集的所有图片的大小,您也应该调整您的值的大小。因此,对于 HOG 没有最佳的“一刀切”值。
但一切都没有丢失。相反,您应该做的是一种“始终”有效的方法。想法是做Spatial Pyramid Matching .这只是在各种规模上进行 HOG 并将它们组合在一起。一张值一千字的图片:
你可以在这里看到,2 级只是带有精细细胞的标准 HOG。但也许它不是最好的尺度(因为单元太小,你只能观察到噪声)(另一方面,太大的单元,如级别 0,可能太大,你会在任何地方都有统一的直方图)。您可以在对数据集进行训练时计算每个级别的最佳权重,并且您将知道最佳值是什么,即:最相关的单元格大小是多少
关于image-processing - 理想数量的 HoG 特征,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24332963/