embedding - 仅使用 vespa 作为矢量数据库而不是嵌入器

标签 embedding nearest-neighbor vespa vector-database

当我尝试存储使用 services.xml 文件中定义的某些模型嵌入的嵌入时,我使用了 Vespa。但是,我打算在外部生成嵌入并将其存储在 Vespa 中,并将其用于最近邻搜索以显式提供查询向量。

但是,我面临为此类用例定义架构的问题。 Schema

Error

最佳答案

要解决此问题:将嵌入字段移至架构中的文档 block 内。 (此外,文档类型应命名为“neighbors”,而不是“schema”。)

说明:您的嵌入字段不会获取另一个字段并对其进行变异,因为当嵌入发生在索引语句中时,它只是文档的一个值。这些必须在文档 block 内定义,因为它们定义了您可以写入和获取的文档类型。

关于embedding - 仅使用 vespa 作为矢量数据库而不是嵌入器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/77105748/

相关文章:

python - Pandas:在一列上近似连接,在其他列上完全匹配

bigdata - 在 vespa 中实现自定义搜索器

c++ - (Embedding Mono) 域的并行激活

r - 在 igraph 中查找顶点的第 n 级邻居

c++ - 将脚本语言集成到 C++ 应用程序中

python - 如何在无监督学习模型(cbow,skipgram)的快速文本中获得最近的邻居?

vespa - 从 Vespa 大规模检索文档

Vespa 教程 – Pig 无法连接到本地 Vespa 端点 : URISyntaxException

c++ - 使用Visual Studio在C++中嵌入Julia

xml - 在 SVG 中嵌入 SVG?