java - é 未正确解析

标签 java linux xerces saxparser

我的应用程序将从 urlconnection 读取 xml。 xml编码为ISO-8859-1,包含é字符。我使用 xerces saxparser 来解析接收到的 xml 内容。但是,在 lunix 操作系统下运行应用程序时无法正确解析 é。在 Windows 中一切正常。你们能给我一些提示吗?非常感谢

最佳答案

这可能是标记为“ISO-8859-1”的文件实际采用另一种编码的情况。

这种情况经常发生在“ISO-8859-1”和“Windows-2152”上:它们被使用时就好像它们可以互换一样,但事实并非如此。 (在对这个答案的评论中,已经阐明两种编码都同意“é”的字符代码,因此 Windows-1252 可能不是。)

您可以使用十六进制编辑器找出文件中“é”的确切字符代码。您可以将该值作为文件编码的提示。如果您可以控制文件的生成方式,那么查看负责的代码/方法也是可取的。

关于java - é 未正确解析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/293728/

相关文章:

java - 如何使用 JFilechooser 将图片添加到 JButton

regex - 如何将多个文件名中的一部分从 1 更改为 01?

linux - PARMRK termios 行为在 Linux 上不起作用

java - Apache Tomcat 启动失败,找不到 SAXParserFactoryImpl

c++ - VS 2015 无法打开编译器生成的文件 : '' : Invalid argument

java - 在最小化的 RDP session 中调用重绘时 Swing 使用大量 CPU

java - 精确计算两个 double 值之间的差异

linux - AR9485 无线网络适配器,带 linux mint

java - 奇怪的 Xerces 方法访问错误

java - GWT JSNI方法暴露