java - 在 elasticsearch 中为 hinglish 创建自定义词干分析器

标签 java elasticsearch lucene

我是 elasticsearch 的新手。我想在 elasticsearch 中创建一个自定义分析器，带有自定义过滤器和自定义词干分析器。我知道 ElasticSearch 是建立在 lucene 之上的，在 lucene 中，自定义词干分析器支持。但是，我找不到任何示例，它显示了 lucene 中的自定义分析器/词干分析器实现以及在 elasticsearch 中的集成。

为糟糕的英语道歉。提前致谢。

Edit 1

我想要的是 Hinglish Stemmer，它将以下输入转换为给定的以下输出:-

Rama, Raam, Ram => ram
Sachin、Sacheen、Sachina、Sacheena、Sachhin => sachin
Kuldeep, Kooldeep, Kuldip, Kooldipa => kuldip

最佳答案

最后，经过几次小插曲，我终于能够创建 hinglish-stemmer 的实现。可通过以下链接获得:-

https://github.com/Mangu-Singh-Rajpurohit/hinglish-stemmer/

关于java - 在 elasticsearch 中为 hinglish 创建自定义词干分析器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43854611/

上一篇：java - 卡在 Java Swing 项目 : Conway's Game of Life

下一篇：java - Project Euler #4 ArrayList 不添加整数

相关文章：

java - 为什么静态成员变量不适用于递归方法中的保留值？

elasticsearch - Elasticsearch --- : MUST_NOT query not working

ruby-on-rails - 使用耐嚼的 Elasticsearch 更新索引后的回调

java - luence中无法删除文档索引

solr - 改进 Solr 搜索查询/过滤器

java - 即使对象指向 null，也不会出现 Nullpointer 异常

java - 如何绕过 web.xml 中的安全过滤器

java - 线程库的无锁实现

Elasticsearch Java API : Return a boolean value

indexing - Solr/Lucene 文档中的部分更新

©2024 IT工具网联系我们