algorithm - 存储和比较多维向量

标签 algorithm vector database-design

我有 n 度的多维向量。处理它们的最佳方法是什么。

  • 存储(存储它们的最佳模式是什么,SQL、Mongo、Document?)
  • 比较(我如何比较两者并找到相似之处)。

例子:

a{1,3,4,1,-1},
b{2,3,3,0,0},
c{2,3,2,8,9}

如果我们比较以上两者,ab更相似。

如何大规模地做到这一点?我想存储数千个这样的向量。

同样可以是矢量距离。 Vector Distance

最佳答案

我对存储的赌注是图形数据库,例如 Neo4j。您可以使用 Cypher 查询计算欧氏距离(并可能实现 k 均值聚类以获得最近点)。

有关实现的详细信息,请查看以下文章 --

关于algorithm - 存储和比较多维向量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37405444/

相关文章:

java - 使用内存计算二项式 choose(n,r) = n!/(r!(n-r)!)

algorithm - 根据权重和选择次数选择随 secret 钥

c++ - 为什么 vector 不改变它的元素?

node.js - NestJs 设计问题 : How can I avoid creating a Nodejs Instance for each team?

ruby-on-rails - 用于数据库记录(雇佣)历史的Rails设计

algorithm - 对以不同方式排序的数组进行排序

c++ - 如何找到 map 的中间元素?? STL

c++ - Vector 的 Fwrite 和 Fread 返回 Segmentation Fault

c++ - 如何循环遍历特定字符串的 vector

php - 1次使用验证码之类的数据是否应该存储在同一张表中