java - 从 JSOUP 解析的 HTML 中删除转义文本

标签 java html escaping jsoup

我正在使用 JSOUP 解析 HTML,其中也包含一些元素。 但是,当我打印生成的 doc.html() 时,而不是:

<script language="JavaScript"> <a href="http://www.company.com/index.htm" </a> </script> 

我得到:

<script language="JavaScript"> &lt;a href=&quot;http://www.company.com/index.htm&quot; &lt;/a&gt; </script>

在代码中,我做了如下操作:

for (final Element src : doc.select("script")) { 
data = data.replace(someText,newText);
src.text(data); <==== I could find this method escapes the text }

我正在使用 UTF-8 字符集。

如何直接获取未转义的文本? 提前致谢!

最佳答案

嘿,谢谢你的帮助... 我们使用以下方法解决了问题:

src.childNode(0).attr("data", data);

关于java - 从 JSOUP 解析的 HTML 中删除转义文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10285568/

相关文章:

java - 在 Java 中计算 HTTP 请求的时间指标

python - 在源代码中查找引用的文本字符串

html - Elm - 不要转义 html 字符串

java - 包含java-问题

java - 正则表达式与空格/非数字/单词边界匹配解释

java - 使用 jdk 中提供的 keytool 生成 SSL 证书

html - 表格单元格图像和文本对齐

javascript - 将鼠标悬停在 div 上时尝试突出显示不同的列

java - 为什么html源代码中缺少 "qaautomation.net"?

objective-c - 嵌套 NSDictionary 描述转义字符问题