我有 n 度的多维向量。处理它们的最佳方法是什么。
- 存储(存储它们的最佳模式是什么,SQL、Mongo、Document?)
- 比较(我如何比较两者并找到相似之处)。
例子:
a{1,3,4,1,-1},
b{2,3,3,0,0},
c{2,3,2,8,9}
如果我们比较以上两者,a
和b
更相似。
如何大规模地做到这一点?我想存储数千个这样的向量。
最佳答案
我对存储的赌注是图形数据库,例如 Neo4j。您可以使用 Cypher 查询计算欧氏距离(并可能实现 k 均值聚类以获得最近点)。
有关实现的详细信息,请查看以下文章 --
关于algorithm - 存储和比较多维向量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37405444/