java - 从 JSOUP 解析的 HTML 中删除转义文本

我正在使用 JSOUP 解析 HTML，其中也包含一些元素。但是，当我打印生成的 doc.html() 时，而不是:

<script language="JavaScript"> <a href="http://www.company.com/index.htm" </a> </script>

我得到:

<script language="JavaScript"> &lt;a href=&quot;http://www.company.com/index.htm&quot; &lt;/a&gt; </script>

在代码中，我做了如下操作:

for (final Element src : doc.select("script")) { 
data = data.replace(someText,newText);
src.text(data); <==== I could find this method escapes the text }

我正在使用 UTF-8 字符集。

如何直接获取未转义的文本？提前致谢!

最佳答案

嘿，谢谢你的帮助... 我们使用以下方法解决了问题:

src.childNode(0).attr("data", data);

关于java - 从 JSOUP 解析的 HTML 中删除转义文本，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10285568/

上一篇：java - Play 2.0 - Java : Adding selected value to @select field

下一篇：java - 创建类路径资源 META-INF/cxf/cxf.xml 中定义的名称为 'cxf' 的 bean 时出错

相关文章：

java - 在 Java 中计算 HTTP 请求的时间指标

python - 在源代码中查找引用的文本字符串

html - Elm - 不要转义 html 字符串

java - 包含java-问题

java - 正则表达式与空格/非数字/单词边界匹配解释

java - 使用 jdk 中提供的 keytool 生成 SSL 证书

html - 表格单元格图像和文本对齐

javascript - 将鼠标悬停在 div 上时尝试突出显示不同的列

java - 为什么html源代码中缺少 "qaautomation.net"？

objective-c - 嵌套 NSDictionary 描述转义字符问题