image-processing - 如何测量用于图像检索的 Fisher 矢量之间的距离?

标签 image-processing machine-learning computer-vision content-based-retrieval

我已经阅读了一些有关 Fisher Vector 的内容,并且仍在学习过程中。它是比经典 BoF 表示更好的表示,利用 GMM(或 k-means,即使通常称为 VLAD)。

但是,我发现它们通常用于分类问题,例如 SVM。

但是图像检索呢?我已经看到它们也被用于图像检索( here ),但我不明白一点:给定两个 FV 代表 2 个图像,我们如何计算它们的距离以及“两个图像有多相似” ?”

在这种情况下使用它们合理吗?

最佳答案

如下面两篇论文所示,欧几里得距离似乎是流行的选择。还有文献提到使用点积作为相似性度量;余弦相似度(紧密相关)是 ML 相似度的普遍流行指标。

http://link.springer.com/article/10.1007/s11263-013-0636-x

http://www.robots.ox.ac.uk/~vgg/publications/2013/Simonyan13/simonyan13.pdf

这足以让您选择满足您需求的东西吗?

关于image-processing - 如何测量用于图像检索的 Fisher 矢量之间的距离?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38058049/

相关文章:

opencv - 设置图像捕获和图像处理的场景

opencv - 使用 emgu 进行姿势估计

c# - 为什么在 WPF 中将 BitmapSource 保存为 bmp、jpeg 和 png 时得到完全不同的结果

image-processing - 如何给图片添加下雨效果?

python - 通过使用梯度下降法,使用 theano 计算神经网络的最佳输入。输入

machine-learning - 机器学习中的动量是什么?

python - 如何从 PyMC3 中的狄利克雷过程中提取无监督集群?

algorithm - 如何通过 N 个点对对象的参数化边界进行采样,从而得到相等的弧长部分?

python - 使用图像处理来清除小文本图像

android - Renderscript 不可调用函数