我是 elasticsearch 的新手。我想在 elasticsearch 中创建一个自定义分析器,带有自定义过滤器和自定义词干分析器。我知道 ElasticSearch 是建立在 lucene 之上的,在 lucene 中,自定义词干分析器支持。但是,我找不到任何示例,它显示了 lucene 中的自定义分析器/词干分析器实现以及在 elasticsearch 中的集成。
为糟糕的英语道歉。提前致谢。
Edit 1
我想要的是 Hinglish Stemmer,它将以下输入转换为给定的以下输出:-
- Rama, Raam, Ram => ram
- Sachin、Sacheen、Sachina、Sacheena、Sachhin => sachin
- Kuldeep, Kooldeep, Kuldip, Kooldipa => kuldip
最佳答案
最后,经过几次小插曲,我终于能够创建 hinglish-stemmer 的实现。可通过以下链接获得:-
关于java - 在 elasticsearch 中为 hinglish 创建自定义词干分析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43854611/