lucene - 我可以自定义 Elastic Search 以使用我自己的停用词列表吗?

标签 lucene stop-words elasticsearch

具体来说,我想在没有停用词列表的情况下为所有内容(例如 who)编制索引。 Elasticsearch 是否足够灵活且易于更改?

最佳答案

默认情况下,elasticsearch 使用的分析器是 standard analyzer使用默认的 Lucene 英语停用词。通过将以下内容添加到 elasticsearch.yml 文件,我已将 elasticsearch 配置为使用相同的分析器但没有停用词。

# Index Settings
index:
  analysis:
    analyzer:
      # set standard analyzer with no stop words as the default for both indexing and searching
      default:
        type: standard
        stopwords: _none_

关于lucene - 我可以自定义 Elastic Search 以使用我自己的停用词列表吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4927629/

相关文章:

elasticsearch - Elasticsearch -使用或条件搜索多个值

python - 将停用词字典导入python

r - 如何使用 R 在法语中准确应用停用词

java - 为什么 Lucene 结果只包含完全匹配?

Solr luceneMatchVersion 语法

python - 将单词添加到 scikit-learn 的 CountVectorizer 的停止列表

elasticsearch - 如何停止登录 Elasticsearch 中的节点?

amazon-web-services - Elasticsearch 1.3.2升级后的问题

java - 在 Lucene 4 中查找搜索命中的位置

java - Infinispan 软索引文件存储问题