我正在使用 jsoup 阅读以下页面:
http://valencia.loquo.com/cs/vivienda/piso-en-alquiler/312
使用以下代码:
Document doc = Jsoup.connect("http://valencia.loquo.com/cs/vivienda/piso-en-alquiler/312").get();
我收到此错误:
java.nio.charset.UnsupportedCharsetException: ISO-LATIN-1
我检查了 HTML 响应 header :
Status Code: 200
Date: Sun, 23 Oct 2011 20:10:02 GMT
Content-Encoding: gzip
X-Pad: avoid browser bug
Connection: Keep-Alive
Content-Length: 13890
Server: Apache/2.2.3 (Debian)
Vary: Accept-Encoding
Content-Type: text/html; charset=iso-latin-1
Keep-Alive: timeout=5, max=100
正如您所看到的,HTML 响应显示 charset=iso-latin-1 ,这可能就是我收到错误的原因。无论如何,我可以看到 HTML 主体响应。有什么方法可以避免此错误并获取文档(使用标准字符集)?
预先感谢您的帮助
达尼洛
最佳答案
您始终可以在没有 JSoup 的情况下下载文档,以编程方式转换编码(这里是 link to the cookbook )并将转换后的字符串传递给 JSoup。
关于java - JSOUP 不支持的字符集异常,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7869200/