search - 我可以保护短单词免受 Solr 中 n-gram 过滤器的影响吗?

标签 search solr lucene n-gram

我见过this question关于在 Solr 中搜索短单词。我想知道是否有其他可能的解决方案来解决类似的问题。我使用的 EdgeNGramFilter 的 minGramSize 为 3。我想保护一组特定的较短单词(主要是两个字母的缩写词)不被忽略,但我希望将 minGramSize 保留为 3 来处理其他内容。 EdgeNGramFilter 不支持 protected 单词列表。是否有任何过滤器或设置可以在单个字段类型中实现这一点,或者我需要编写一个吗?

或者,我是否以错误的方式思考这个问题?

最佳答案

认真思考了这个问题,但你提到的另一个问题的答案似乎是唯一的方法。不过,这对于 EdgeNGramFilter 来说是一个有用的功能。

目前,您可以保留一个副本字段和一个 KeepWordFilterFactory只需使用您需要的首字母缩略词即可。或者,如果您事先不知道首字母缩略词列表,请使用 LengthFilter .

关于search - 我可以保护短单词免受 Solr 中 n-gram 过滤器的影响吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15004758/

相关文章:

python - 在字典中递归查找键

algorithm - 访问网格上每个 "special"点所需的最少步数

使用特殊字符在 solr 中搜索

SolrCloud 负载均衡

lucene - 如何设置ElasticSearch以对电子邮件地址执行SQL LIKE “%”?

azure - LuceneNet 是如何工作的以及以下场景的实现可行性?

php - 检索谷歌搜索结果

c# - 实现搜索结果的线程安全缓存

solr - 如何使用ManifoldCF或nutch抓取具有SAML身份验证的网站?

Solr 不接受带点的查询