elasticsearch - ElasticSearch 的停用词/同义词/等文件

标签 elasticsearch elasticsearch-plugin

我曾经使用 Solr,它会有包含停用词、同义词等文件的配置文件夹。每次进行更改时,您都可以使用 Zookeeper 下载 conf 文件,然后将其上传并分发到集群中的所有服务器。

ElasticSearch 的新手,所以请原谅这个问题:有没有办法让我自动创建这样的文件并让 Zookeeper 或其他东西自动分发它而不是手动步骤(或 Puppet 脚本)

根据这个:http://www.elastic.co/guide/en/elasticsearch/guide/master/using-synonyms.html文件必须存在,但没有提及如何存在。

另外,我发现了这个:https://github.com/lindstromhenrik/elasticsearch-analysis-file-watcher-synonym不确定它是否有效。上面的日期似乎不太乐观。

最佳答案

如何分发文件超出了我回答您问题的能力范围,但是:

“同义词”的外部文件,如“停用词”,在两种情况下被读取:

  • 当您创建分析器时
  • 当你重启你的节点时

该指南有一节介绍如何 update the stopwords列表。这也适用于同义词。

在我的实践中,我发现直接在 JSON 负载中提供同义词更容易。避免我对服务器、文件位置等实际基础设施“了解太多”。

关于elasticsearch - ElasticSearch 的停用词/同义词/等文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30132959/

相关文章:

node.js - Elasticsearch _bulk 更新问题给出 VersionConflictEngineException 消息

elasticsearch - 将元素附加到 Elasticsearch 字段

elasticsearch - ElasticSearch:在groovy脚本中找不到[“+ field + ”]的字段

docker - 如何在 ubuntu 中使用 fscrawler?

elasticsearch - 如何对精确,语音和模糊查询赋予不同的权重?

elasticsearch - 如何使用 Java API 设置摄取附件(elasticsearch)插件选项?

grails - 对Grails中的Elastic Search结果调用findBy…时发生TransientObjectException

elasticsearch - 如何在Elasticsearch中用 “Others”替换所有空/空白值?

elasticsearch - 如何按列表中的现有状态排序

elasticsearch - 为什么在Moqui中发生有关 Elasticsearch 的异常(exception)情况?