elasticsearch - 选择正确的min_gram和max_gram ngram值

标签 elasticsearch mapping n-gram

与min_gram:3和max_gram:3的ngram分析器一起使用min_gram:3 max_gram:10的ngram分析器有什么好处?

当min_gram等于max_gram时,与min_gram和max_gram不同的情况相比,数据库大小将小得多。

当min_gram和max_gram小于查询本身时,该查询将没有max_gram大小的任何块,并且当max_gram等于3时,我仍然能够找到“Opel”。

我想念什么吗?

可能与排名有关吗?

当max_gram等于4时,与“Opel”一起使用比在ngram等于3时,与“Opel”一起搜索会更好?

当min_gram和max_gram具有不同的值时,使用ngram(不是边缘ngram)有什么好处?

最佳答案

这可能是正确的,但可能不是。取决于您有多少个带有“ope”的单词。您可能会松开opel而不是open,opera,oped,operand等。特别是如果这不是边缘ngram,那么您还将有诸如hope,rope之类的词。但是范围相对较小(例如,搜索汽车品牌可能会产生可接受的结果)

关于elasticsearch - 选择正确的min_gram和max_gram ngram值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47919820/

相关文章:

elasticsearch - 无法在ElasticSearch中的query_string中将字母数字字符串与通配符匹配

elasticsearch - 如何在Elasticsearch中设置全局_ttl

elasticsearch - java.lang.instantiationerror org.elasticsearch.common.transport.transportaddress

elasticsearch - 使用正则表达式的 Kibana 无法按预期工作

database - 如何在Grails中将外键映射为主键?

python - 从字符串生成 n-gram

eclipse - 非法参数异常 : The servlets named [WrongServlet2] and [Wrong] are both mapped to the url-pattern [/Wrong] which is not permitted

java - 如何在 Hibernate 中进行映射

java - 使用 Mallet Java Api 支持主题建模中的二元组

performance - 在多个过滤器上优化聚合查询