全部
我正在寻找在 http://www.wisdom.weizmann.ac.il/~bagon/CVspring07/files/scalable.pdf 中应用 David Nister 和 Henrik Stewenius 的相同方法。
在本文中,他们使用大量 SIFT 向量 (128-D) 作为分层 k 均值聚类的输入,以构建分层视觉词汇树。
有谁知道我可以用来进行此聚类的任何好的库吗?
Ps:输入 SIFT 描述符的数量很高(70,000,000),我希望结果将是一个具有 1,000,000 个叶节点的词汇树。
非常感谢。 问候。
最佳答案
OpenIMAJ 中的 ClusterQuantiser 工具如果数据采用受支持的格式,应该能够执行此操作。如果该工具无法立即使用您的数据,那么您可以为org.openimaj.ml.clustering.kmeans.HierarchicalByteKMeans
编写驱动程序。类(在 svn trunk 版本中)或 org.openimaj.ml.clustering.kmeans.HByteKMeans
1.0.5 版本中的类。该类的两个版本都支持来自磁盘的流数据,因此您不需要将所有功能保存在内存中!
为了完整起见,vlfeat还有一个分层的 k-means 实现,但我不确定它的扩展程度。
根据实际经验,您还可以考虑在聚类之前对特征进行采样。我不确定您是否会从将它们全部聚类中获得很多好处。
关于cluster-analysis - SIFT 向量的分层 k 均值聚类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10993870/