java - 在 Java 中将损坏的字符转换为正确的值

标签 java android xml jsoup

我当前正在读取外部 XML 文件。

在我正在从 Android 应用程序中读取歌曲标题和音乐艺术家姓名的 RSS 提要中,撇号字符 ' 呈现为 ',而 é(带有重音符号的 e)则表示为 é。

我当前的代码从 XML 读取,但原始 XML 文件在表示这些字符等方面存在问题。这并不总是发生,但我想弄清楚如何正确阅读它。我是否要在 Java 中更改 XML 的编码,或者是否有办法将这些字符转换为应有的字符?

编辑:事实证明,以 UTF-8 查看 XML 页面可以正确呈现字符。有没有办法使用 Jsoup 库读取 UTF-8 编码的 XML 文档?

最佳答案

默认情况下,Jsoup 将在 http header 中使用 Content-Type 来呈现文件,但您可以显式地将编码类型传递给 Jsoup.parse () 方法如下:

Document document = Jsoup.parse(yourXML, "UTF-8");

关于java - 在 Java 中将损坏的字符转换为正确的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36109232/

相关文章:

android - Base64 元素(来自 xml)太大而不能存储在字符串中?

c# - .NET:在验证/读取 XML 模式时阻止 Web 访问?

android - java.security.cert.CertPathValidatorException : Trust anchor for certification path not found

objective-c - 在 Cocoa 中使用 XML 编写游戏关卡

Java 8 AcceptEither CompletableFuture 示例

java - 使用 Guice 将数据注入(inject) JavaFX ViewController

Android appwidget remoteviews 不更新

Android Realm for 循环 - RealmResults 在循环期间被删除

java - java默认支持哪些数据库

javascript - 来自 servlet 的警报返回空白页