java - 带有 org.w3c.dom API 的外部和内部 HTML

标签 java html dom

我正在使用 org.w3c.dom API 来解析一个 HTML 片段,它由一系列

标记组成,中间有各种标记。我正在尝试将 HTML 片段摄取到 org.w3c.dom.Document 并将 HTML 拆分为 <p>..</p>

我可以轻松获得 <p> 的节点列表标签(doc.getElementsByTagName("p")),但是从 NodeList 中我无法获得 NodeList 中元素的等效“innerHTML”和“outerHTML”。

如何使用 org.w3c.dom API 获得 innerHTML 和 outerHTML 的等效项? (我不想引入另一个依赖,比如 JSoup)

最佳答案

inner/outerHTML只是方便的方法,它们本质上是通过 DOM 解析器和序列化程序将文档片段序列化到字符串或从字符串序列化。 您可以使用 DOM Load/Save APIs “步行”获得相同的结果。

参见 this answer如何使用它们。

关于java - 带有 org.w3c.dom API 的外部和内部 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28133157/

相关文章:

java - 修昔底德:从头开始安装原型(prototype) - 跳过所有测试

javascript - Polymer 中是否支持带有破折号的属性和属性?

javascript - 如何在 Chrome 开发者工具中禁用加载时的特定脚本

PHP:DOMDocument loadHTML 在使用 HTML5 标签时返回错误

javascript - 如何获取有序列表的长度?

java - 高效地将多个大型 xml 文件合并为一个文件

具有泛型方法和子类的 Java Collection

Java - BungeeCord 关闭

javascript - 在网页上加载 Flash 横幅后添加 cookie

javascript - Angular Material md-subheader 不粘