cluster-analysis - SIFT 向量的分层 k 均值聚类

标签 cluster-analysis hierarchical-data sift descriptor object-recognition

全部

我正在寻找在 http://www.wisdom.weizmann.ac.il/~bagon/CVspring07/files/scalable.pdf 中应用 David Nister 和 Henrik Stewenius 的相同方法。

在本文中,他们使用大量 SIFT 向量 (128-D) 作为分层 k 均值聚类的输入,以构建分层视觉词汇树。

有谁知道我可以用来进行此聚类的任何好的库吗?

Ps:输入 SIFT 描述符的数量很高(70,000,000),我希望结果将是一个具有 1,000,000 个叶节点的词汇树。

非常感谢。 问候。

最佳答案

OpenIMAJ 中的 ClusterQuantiser 工具如果数据采用受支持的格式,应该能够执行此操作。如果该工具无法立即使用您的数据,那么您可以为org.openimaj.ml.clustering.kmeans.HierarchicalByteKMeans编写驱动程序。类(在 svn trunk 版本中)或 org.openimaj.ml.clustering.kmeans.HByteKMeans 1.0.5 版本中的类。该类的两个版本都支持来自磁盘的流数据,因此您不需要将所有功能保存在内存中!

为了完整起见,vlfeat还有一个分层的 k-means 实现,但我不确定它的扩展程度。

根据实际经验,您还可以考虑在聚类之前对特征进行采样。我不确定您是否会从将它们全部聚类中获得很多好处。

关于cluster-analysis - SIFT 向量的分层 k 均值聚类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10993870/

相关文章:

regex - 正则表达式问题:上下文匹配

mysql - 如何找到树表示的层次结构路径

python-2.7 - 使用 opencv 从 SIFT 生成以百分比表示的相似度分数

r - 图形窗口在 `kml` 包中无法正常工作

text - 基于相似度的文本流聚类算法最近有什么突破吗?

algorithm - 基于纬度/经度的物流路由和隔离算法

windows - ucrtbase.dll : An invalid parameter was passed to a function that considers invalid parameters fatal

java - Hadoop Java 与 C/C++ 在 CPU 密集型任务上的对比

mysql - 父类别的所有子类别列表

python - 类型 'KeyPoint'的对象不是JSON可序列化的opencv