java - JSOUP 不支持的字符集异常

标签 java jsoup

我正在使用 jsoup 阅读以下页面:

http://valencia.loquo.com/cs/vivienda/piso-en-alquiler/312

使用以下代码:

Document doc = Jsoup.connect("http://valencia.loquo.com/cs/vivienda/piso-en-alquiler/312").get();

我收到此错误:

java.nio.charset.UnsupportedCharsetException: ISO-LATIN-1

我检查了 HTML 响应 header :

Status Code: 200
Date: Sun, 23 Oct 2011 20:10:02 GMT
Content-Encoding: gzip
X-Pad: avoid browser bug
Connection: Keep-Alive
Content-Length: 13890
Server: Apache/2.2.3 (Debian)
Vary: Accept-Encoding
Content-Type: text/html; charset=iso-latin-1
Keep-Alive: timeout=5, max=100

正如您所看到的,HTML 响应显示 charset=iso-latin-1 ,这可能就是我收到错误的原因。无论如何,我可以看到 HTML 主体响应。有什么方法可以避免此错误并获取文档(使用标准字符集)?

预先感谢您的帮助

达尼洛

最佳答案

您始终可以在没有 JSoup 的情况下下载文档,以编程方式转换编码(这里是 link to the cookbook )并将转换后的字符串传递给 JSoup。

关于java - JSOUP 不支持的字符集异常,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7869200/

相关文章:

java自动代​​理配置

java - 如何将 return 与数组一起使用?

java - 折线未显示在 2 个位置之间,但显示时间和距离

java - 在 pageObject.PartnerNavigationDrawer.Profile 处获取 java.lang.NullPointerException(PartnerNavigationDrawer.java :30) when I call method

android - 错误异步任务 doInBackground() & JSoup

java - 在 Java 中使用 substring()

java - 如何在构造函数中同时解析 URL?

java - 运行外部可执行文件 (.exe) 并等待其完成

java - 执行./bin/start-hbase.sh时发生Hbase错误(Windows)

java - JSOUP 解析表格中的表单字段和标签