我们有文章索引。文章属性之一是“标签”,其具有一组数字作为值,类似于[131、111、113]。
因此,我需要进行查询,在其中可以通过其标签值找到与另一篇文章相关的文章。
此查询还应考虑哪篇文章具有更多匹配标签。因此,如果一篇文章具有两个匹配的标签,但是另一篇文章具有3个匹配的标签,则该文章应包含在响应中。
我一直在看“更像这样” https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-mlt-query.html
但是那个似乎只是基于文本。
最佳答案
我认为significant terms agg在这里会有所帮助。它使用功能选择来建议文档。在这种情况下,“标签”字段上的sigterms将为您提供最重要的标签。
关于elasticsearch - Elasticsearch :通过标签相似度获取相关内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60605825/