java - 停止 Jsoup 编码

标签 java jsoup

我正在尝试使用包含以下文本的 JSoup 解析 URL:Ætterni。 解析文档后,相同的字符串如下所示:Ætterni

如何防止这种形式发生?我想要原样 1:1 的文档。

代码:

doc = Jsoup.connect(url).get();
String docEncoding=doc.outputSettings().charset().name();
OutputStreamWriter writer = new OutputStreamWriter(new FileOutputStream(localLink),docEncoding);
writer.write(doc.html());
writer.close();

最佳答案

使用 doc.outputSettings().escapeMode(EscapeMode.xhtml); 用于避免实体转换。

关于java - 停止 Jsoup 编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6279064/

相关文章:

Java 流 : get values grouped by inner map key

java - jsoup 无法返回包含所有子节点的完整节点

java - 名为 `{java}` 的线程(即轻量级进程)是为了什么而创建的?

Java 作为 Java 的脚本语言?

java - jsoup 获取与它们相关的特定标签和值

html - 如何提取该网页中的所有章节标题?

java - 多个引用和重复结果的相同 div (Jsoup)

java - 如何组合jsoup选择器中的属性

java - 使用 Jsoup 从特定 html 源中提取值

java - 当 Web 服务器线程中出现 OutOfMemoryError 时,Spring 启动请求会挂起