我已经阅读了一些有关 Fisher Vector 的内容,并且仍在学习过程中。它是比经典 BoF 表示更好的表示,利用 GMM(或 k-means,即使通常称为 VLAD)。
但是,我发现它们通常用于分类问题,例如 SVM。
但是图像检索呢?我已经看到它们也被用于图像检索( here ),但我不明白一点:给定两个 FV 代表 2 个图像,我们如何计算它们的距离以及“两个图像有多相似” ?”
在这种情况下使用它们合理吗?
最佳答案
如下面两篇论文所示,欧几里得距离似乎是流行的选择。还有文献提到使用点积作为相似性度量;余弦相似度(紧密相关)是 ML 相似度的普遍流行指标。
http://link.springer.com/article/10.1007/s11263-013-0636-x
http://www.robots.ox.ac.uk/~vgg/publications/2013/Simonyan13/simonyan13.pdf
这足以让您选择满足您需求的东西吗?
关于image-processing - 如何测量用于图像检索的 Fisher 矢量之间的距离?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38058049/