java - 带有 org.w3c.dom API 的外部和内部 HTML

我正在使用 org.w3c.dom API 来解析一个 HTML 片段，它由一系列

标记组成，中间有各种标记。我正在尝试将 HTML 片段摄取到 org.w3c.dom.Document 并将 HTML 拆分为 <p>..</p>

我可以轻松获得 <p> 的节点列表标签(doc.getElementsByTagName("p"))，但是从 NodeList 中我无法获得 NodeList 中元素的等效“innerHTML”和“outerHTML”。

如何使用 org.w3c.dom API 获得 innerHTML 和 outerHTML 的等效项？ (我不想引入另一个依赖，比如 JSoup)

最佳答案

inner/outerHTML只是方便的方法，它们本质上是通过 DOM 解析器和序列化程序将文档片段序列化到字符串或从字符串序列化。您可以使用 DOM Load/Save APIs “步行”获得相同的结果。

参见 this answer如何使用它们。

关于java - 带有 org.w3c.dom API 的外部和内部 HTML，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28133157/