我读到Dalal and Triggs HOG 描述论文和博客 Chris McCormick关于同样的事情。该博客表示,图像需要以不同的比例重新采样才能识别不同的人。
我的问题是:我们已经有一个窗口,放置在尺寸为 64*128 的图像上,并在图像上滑动。那么为什么要重新采样而不是在图像上滑动整个窗口来检测人员呢? ?
如有错误,请指正,先谢过!!
最佳答案
您说得对,64*128 的大小经过训练可以被分类为“人”或“非人”。但是,现实世界中的所有人物图像是否都始终采用方便的 64*128 尺寸?
这就是缩放发挥作用的地方。通过逐渐缩小图像,相同的 64*128 像素区域将覆盖原始图像中更大的区域,从而可以检测多种体型的人物。
例如,这是我的一个模型在多个尺度上运行检测后的示例。给出的结果是应用非极大值抑制来清除多余的检测窗口后的结果。
关于image-processing - HOG特征中需要对图像进行重新采样吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37460315/