java - Elastic Java Boost 日期

我希望跟进 this根据日期提升结果的问题。然而，在这个问题中，衰减函数似乎优先于实际搜索内容。

QueryBuilder qb = QueryBuilders.multiMatchQuery(term,"title", "description","url").field("title", 1.75f).field("url", 1.55f).field("description", 1.35f);
FunctionScoreQueryBuilder builder = QueryBuilders.functionScoreQuery(qb);
builder.add(ScoreFunctionBuilders.exponentialDecayFunction("postDate","14d"));

例如，如果我使用上述构建器在我的索引中搜索有关 Mario Draghi 的推文，如果过去 14 天内有较新的推文提到“Mario Draghi”，那么它们首先出现，然后是过去 14 天内提到的推文任何其他与“Mario”匹配的内容(而不是显示旧的“Mario Draghi”推文)。

我想要做的基本上是增强文档，如果其日期字段“postDate”是新的(比方说 14 天)，但我不希望日期优先于搜索的准确性。我更喜欢旧的“马里奥·德拉吉”推文而不是“ super 马里奥兄弟”推文。换句话说，我的索引中有数千条推文提到 Mario Draghi - 但在上面的代码中，我仅在 14 天内收到它们。

有人可以指出我更准确的完成方法吗？我在这个post中看到提升幅度在一定范围内。这对我来说很有意义——但我想知道这是否是实现目标的首选方式？我希望有一种更优雅的方式？

最佳答案

在许多情况下，期望的结果是保留您的相关性分数，并为最近的匹配项提供额外的提升(更高的分数)，因为数据更新鲜。为了实现这一点，您可以使用 Elasticsearch 的评分功能。 Webpage Source .

final MultiMatchQueryBuilder multiMatchQuery = QueryBuilders.multiMatchQuery("Bababooey", "title^0.8", "url^0.6", "description^0.3").type(MultiMatchQueryBuilder.Type.BEST_FIELDS);

final FunctionScoreQueryBuilder functionScoreQuery = QueryBuilders.functionScoreQuery(multiMatchQuery);
functionScoreQuery.scoreMode("multiply");
functionScoreQuery.boostMode(CombineFunction.MULT);
functionScoreQuery.add(ScoreFunctionBuilders.gaussDecayFunction("postDate","130w").setOffset("26w").setDecay(0.3));

这个例子增强了过去半年发布的所有文档。超过六个月的文件得分将逐渐降低，直到达到两年半的阈值。超过两年半的文档不会根据新近度获得任何额外评分。通过更改 setOffet 和 setDecay 可以轻松地将其转移到两周或任何可能的提升窗口...

关于java - Elastic Java Boost 日期，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31521249/

java - Elastic Java Boost 日期

上一篇：java - 阻止 System.out 将大数和小数放入标准形式

下一篇：java - Hibernate 实现通过传递不同类型的参数