我正在尝试使用包含以下文本的 JSoup 解析 URL:Ætterni
。
解析文档后,相同的字符串如下所示:Ætterni
。
如何防止这种形式发生?我想要原样 1:1 的文档。
代码:
doc = Jsoup.connect(url).get();
String docEncoding=doc.outputSettings().charset().name();
OutputStreamWriter writer = new OutputStreamWriter(new FileOutputStream(localLink),docEncoding);
writer.write(doc.html());
writer.close();
最佳答案
使用
doc.outputSettings().escapeMode(EscapeMode.xhtml);
用于避免实体转换。
关于java - 停止 Jsoup 编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6279064/