我当前正在读取外部 XML 文件。
在我正在从 Android 应用程序中读取歌曲标题和音乐艺术家姓名的 RSS 提要中,撇号字符 ' 呈现为 ',而 é(带有重音符号的 e)则表示为 é。
我当前的代码从 XML 读取,但原始 XML 文件在表示这些字符等方面存在问题。这并不总是发生,但我想弄清楚如何正确阅读它。我是否要在 Java 中更改 XML 的编码,或者是否有办法将这些字符转换为应有的字符?
编辑:事实证明,以 UTF-8 查看 XML 页面可以正确呈现字符。有没有办法使用 Jsoup 库读取 UTF-8 编码的 XML 文档?
最佳答案
默认情况下,Jsoup
将在 http header 中使用 Content-Type
来呈现文件,但您可以显式地将编码类型传递给 Jsoup.parse ()
方法如下:
Document document = Jsoup.parse(yourXML, "UTF-8");
关于java - 在 Java 中将损坏的字符转换为正确的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36109232/