algorithm - k-NN 搜索超大维度(~100,000)

标签 algorithm knn

有没有关于 10k - 100k 等大量维度的 k-NN 搜索问题的文章?

大多数对真实世界数据进行测试的文章都以 10-50 dims 运行,少数运行 100-500。

在我的例子中,在 ~100k 的特征维度中有 ~10^9 个点,并且没有办法有效地减少维数。

更新: 目前我们正在尝试调整和实现 VP 树,但很明显,这个维度上的任何树结构都不会很好地工作。

第二种方法是 LSH,但根据数据分布,准确性可能存在很大问题。

最佳答案

看看FLANN图书馆。

this paper你会发现一篇论文是关于数据维度如何成为对最近邻匹配性能影响很大的因素之一,以及FLANN中采用的解决方案。

关于algorithm - k-NN 搜索超大维度(~100,000),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17191398/

相关文章:

algorithm - 如何在没有分配的情况下将循环缓冲区转换为 O(n) 中的向量?

java - DataBase(数据模型)构建文件夹结构

r - R 中 data.frame 内的矩阵或其他嵌套结构

matlab - 如何在matlab中确定矩阵的k最近邻算法的k值

algorithm - OCR 和真实字符串相似度

algorithm - 检查某个数字是否适合大量范围的最有效方法

r - 调整 R 中 knn train() 命令中的 K

algorithm - 为什么 KNN 的余弦距离比欧几里得距离快得多?

algorithm - 决策树与朴素贝叶斯与 KNN

c++ - 3 的中位数,使用迭代器进行快速排序