我有两个关于在 Lucene 中处理德语变音符号的问题:
我正在尝试找到一种方法,将写为“ue”、“ae”等的德语变音符号转换为折叠形式“u”、“a”等。 这是由 GermanAnalyzer(以及它使用的 German2StemFilter)完成的,但不幸的是,它也会进行词干提取,这在我的情况下是非常不希望的。 是否有任何其他过滤器只能进行 'ue' -> 'u' 转换?
是否有任何过滤器执行“ü”->“ue”(不是像 ASCIIFoldingFilter 那样的“u”)转换?我想要实现的是,只要用户搜索“über”或“ueber”而不是“uber”,就应该在索引中找到单词“über”。
最佳答案
german2 的算法但没有词干提取:
关于java - 德语 'ue' -> Lucene 中的 'u' 转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13451276/