我的应用程序将从 urlconnection 读取 xml。 xml编码为ISO-8859-1,包含é字符。我使用 xerces saxparser 来解析接收到的 xml 内容。但是,在 lunix 操作系统下运行应用程序时无法正确解析 é。在 Windows 中一切正常。你们能给我一些提示吗?非常感谢
最佳答案
这可能是标记为“ISO-8859-1”的文件实际采用另一种编码的情况。
这种情况经常发生在“ISO-8859-1”和“Windows-2152”上:它们被使用时就好像它们可以互换一样,但事实并非如此。 (在对这个答案的评论中,已经阐明两种编码都同意“é”的字符代码,因此 Windows-1252 可能不是。)
您可以使用十六进制编辑器找出文件中“é”的确切字符代码。您可以将该值作为文件编码的提示。如果您可以控制文件的生成方式,那么查看负责的代码/方法也是可取的。
关于java - é 未正确解析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/293728/