是否有任何简单/轻量级的解决方案来将至少一些非 ASCII 符号更改为相应的 ASCII 类似物?例如这个字符串
abc-åäö.txt
应该改为
abc-aao.txt
一些背景知识:Zip 工具不能可靠地支持 UTF-8,因此需要降级。 AFAICR Google“将附件下载为单个 zip 文件”功能将所有非 ascii 符号替换为“_”字符。
PS:代码也可能是用其他语言编写的,如果它或多或少可以理解,我会将其移植到 Java。 PPS:到目前为止我的第一个问题,所以请不要把我减到地下好吗?
最佳答案
看看 java.text.Normalizer
。它可以帮助您转换等效字符:http://en.wikipedia.org/wiki/Unicode_equivalence
关于java - 将非 ASCII 符号降级为最接近的 7 位 ASCII 等价物(最好是 Java),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3351888/