我需要在 Java 中执行从 UTF-8 到 ISO-8859-1 的字符转换,而不会丢失所有 UTF-8 特定标点符号。
理想情况下,希望将它们转换为 ISO 中的等效字符(例如,UTF-8 中可能有 5 个不同的单引号,并且希望将它们全部转换为 ISO 单引号字符)。
String.getBytes("ISO-8859-1") 在这种情况下不起作用,因为它会丢失 UTF-8 特定的字符。
您是否知道 Java 中有任何现成的映射或库可以将 UTF-8 特定字符映射到 ISO?
最佳答案
IBM 的 ICU项目可能就是您正在寻找的。它支持后备转换。
关于java - Java 中的 UTF-8 到 ISO-8859-1 映射/无损转换库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2362918/