java - 将非 ASCII 符号降级为最接近的 7 位 ASCII 等价物(最好是 Java)

标签 java unicode character-encoding ascii

是否有任何简单/轻量级的解决方案来将至少一些非 ASCII 符号更改为相应的 ASCII 类似物?例如这个字符串

abc-åäö.txt

应该改为

abc-aao.txt

一些背景知识:Zip 工具不能可靠地支持 UTF-8,因此需要降级。 AFAICR Google“将附件下载为单个 zip 文件”功能将所有非 ascii 符号替换为“_”字符。

PS:代码也可能是用其他语言编写的,如果它或多或少可以理解,我会将其移植到 Java。 PPS:到目前为止我的第一个问题,所以请不要把我减到地下好吗?

最佳答案

看看 java.text.Normalizer。它可以帮助您转换等效字符:http://en.wikipedia.org/wiki/Unicode_equivalence

关于java - 将非 ASCII 符号降级为最接近的 7 位 ASCII 等价物(最好是 Java),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3351888/

相关文章:

python - 将文本文件中的 ascii 字符转换为 Unicode

ruby - 如何在 ruby​​ 的 URI 库中使用变音符号

java - Excel 导出中的乱码

PHP - MySQL 数据库中编码错误的土耳其语字符

java - 将java连接到mysql域服务器

java - Java RegEx 模式中 Alnum 和 IsAlphabetic 字符类之间的关系

java - 渲染针对调色板有限的设备的 2D 图像

java - 用于签名计算的 HMAC-SHA256 算法

java - 方法级变量范围

java - Maven 站点 :deploy Compile Error : "cannot find symbol" - how can a specific dependency be excluded?