我有一个带有已保存电影标题的Elasticsearch数据库。
我想要实现的是从此数据库中选择最接近的匹配项,以查看我是否已经有一个相似的标题。
目前,我正在使用短语匹配和单词匹配的组合来尝试实现这一目标。我所挣扎的如下:
在数据库中:
晚上来
搜索:
它
这显然很匹配,因为它在slop参数中,并且将100%的单词与数据库中的单词匹配...
但是我想要的是该搜索失败,因为我的搜索仅包含elasticsearch中整个句子的25%。 (几乎像是反向比赛)。
原因是“It”和“It at night”实际上是2个不同的标题,在进行此搜索时可能已经/可能尚未索引。
我之所以不简单使用字词查询的原因是:
银河护卫队2
与
银河护卫队2
与
银河护卫队2
有谁知道是否可以在Elasticsearch中实现?
最佳答案
目前,我已使用以下各项的组合:
这给了我我所期望的。
关于elasticsearch - Elasticsearch文字匹配百分比,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46093832/