我正在使用视觉单词袋进行分类。
我已将每个图像的SIFT描述符量化为100个单词,并对图像的直方图进行了编码,并完成了分类。
现在,我想尝试组合两个不同的描述符和检测器,即SIFT和SURF,这意味着关键点的数量不会相同,描述符维数也不会相同(SIFT 128D和SURF 64D)。
合并它们的最简单方法是什么?
如果对于每张图像,我为SIFT编码一个直方图(将为100x1直方图),为SURF编码另一个直方图(另一个100x1),然后将它们堆叠在一起制成200x1直方图,那是正确的吗?
还有其他方法吗?
非常感谢。
最佳答案
用词袋来说,关键点的数量或描述符的大小无关紧要,一旦生成代码簿,您将获得一个直方图,其大小取决于代码簿的大小。同样,直方图被归一化,因此它不取决于每个图像检测到的特征数量。假设您具有SIFT和SURF功能,您要做的就是生成2个码本并将它们连接起来以获得特征 vector 。
这里提到该方法的简要概述:
http://en.wikipedia.org/wiki/Bag-of-words_model_in_computer_vision
关于matlab - 在视觉文字袋中组合检测器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23581440/