我正在寻找一个表或启发式库,可以将扩展字符(例如上面带有帽子的 o)转换为常规的 ascii o。
我这样做是出于搜索索引的目的,因为大多数人不会用帽子键入 o。
例如,我在搜索中输入“Cote”,但我希望搜索包含“Côte”等内容。
看来 Solr 不会转换这些。
我尝试了 java.text.Normalizer 和 friends,但这不起作用。 确实有效,请参阅下面的解决方案。
最佳答案
您想要使用ASCIIFoldingFilterFactory在 Solr 中执行索引和查询分析时。如果你想要这个独立的,你可以获取源代码并执行它所做的任何事情。
关于java - 将字符(欧洲)扩展为美国 ascii,用于搜索索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5443165/