我正在使用 JSOUP 解析 HTML,其中也包含一些元素。 但是,当我打印生成的 doc.html() 时,而不是:
<script language="JavaScript"> <a href="http://www.company.com/index.htm" </a> </script>
我得到:
<script language="JavaScript"> <a href="http://www.company.com/index.htm" </a> </script>
在代码中,我做了如下操作:
for (final Element src : doc.select("script")) {
data = data.replace(someText,newText);
src.text(data); <==== I could find this method escapes the text }
我正在使用 UTF-8 字符集。
如何直接获取未转义的文本? 提前致谢!
最佳答案
嘿,谢谢你的帮助... 我们使用以下方法解决了问题:
src.childNode(0).attr("data", data);
关于java - 从 JSOUP 解析的 HTML 中删除转义文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10285568/