java - 在 elasticsearch 中为 hinglish 创建自定义词干分析器

标签 java elasticsearch lucene

我是 elasticsearch 的新手。我想在 elasticsearch 中创建一个自定义分析器,带有自定义过滤器和自定义词干分析器。我知道 ElasticSearch 是建立在 lucene 之上的,在 lucene 中,自定义词干分析器支持。但是,我找不到任何示例,它显示了 lucene 中的自定义分析器/词干分析器实现以及在 elasticsearch 中的集成。

为糟糕的英语道歉。提前致谢。

Edit 1

我想要的是 Hinglish Stemmer,它将以下输入转换为给定的以下输出:-

  • Rama, Raam, Ram => ram
  • Sachin、Sacheen、Sachina、Sacheena、Sachhin => sachin
  • Kuldeep, Kooldeep, Kuldip, Kooldipa => kuldip

最佳答案

最后,经过几次小插曲,我终于能够创建 hinglish-stemmer 的实现。可通过以下链接获得:-

https://github.com/Mangu-Singh-Rajpurohit/hinglish-stemmer/

关于java - 在 elasticsearch 中为 hinglish 创建自定义词干分析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43854611/

相关文章:

java - 为什么静态成员变量不适用于递归方法中的保留值?

elasticsearch - Elasticsearch --- : MUST_NOT query not working

ruby-on-rails - 使用耐嚼的 Elasticsearch 更新索引后的回调

java - luence中无法删除文档索引

solr - 改进 Solr 搜索查询/过滤器

java - 即使对象指向 null,也不会出现 Nullpointer 异常

java - 如何绕过 web.xml 中的安全过滤器

java - 线程库的无锁实现

Elasticsearch Java API : Return a boolean value

indexing - Solr/Lucene 文档中的部分更新