java - 德语 'ue' -> Lucene 中的 'u' 转换

标签 java lucene diacritics

我有两个关于在 Lucene 中处理德语变音符号的问题:

  1. 我正在尝试找到一种方法,将写为“ue”、“ae”等的德语变音符号转换为折叠形式“u”、“a”等。 这是由 GermanAnalyzer(以及它使用的 German2StemFilter)完成的,但不幸的是,它也会进行词干提取,这在我的情况下是非常不希望的。 是否有任何其他过滤器只能进行 'ue' -> 'u' 转换?

  2. 是否有任何过滤器执行“ü”->“ue”(不是像 ASCIIFoldingFilter 那样的“u”)转换?我想要实现的是,只要用户搜索“über”或“ueber”而不是“uber”,就应该在索引中找到单词“über”。

最佳答案

关于java - 德语 'ue' -> Lucene 中的 'u' 转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13451276/

相关文章:

Java 删除变音符号

java - 我怎样才能使这个 JButton 可见?当我有逐行扫描背景 JWindow() 时?

java - 如何将内部没有可序列化字段的java对象序列化为字节数组并反序列化该数组以获得原始对象

Java:如何检查世界上是否存在某个对象的特定实例?

java - 如何在 for 循环中将数据写入字符串

performance - 在Elasticsearch中优化使用简单博客应用程序的类型和路由

php - 自动完成电影名称

lucene - Lucene/ElasticSearch 的不错的多语言词干分析器或分析器?

matlab - 如何以 Matlab eps 格式导出变音符号(或任何外来字符)?

python - 删除特殊字符但不删除重音字母