我正在使用 org.w3c.dom API 来解析一个 HTML 片段,它由一系列
标记组成,中间有各种标记。我正在尝试将 HTML 片段摄取到 org.w3c.dom.Document 并将 HTML 拆分为 <p>..</p>
我可以轻松获得 <p>
的节点列表标签(doc.getElementsByTagName("p")
),但是从 NodeList 中我无法获得 NodeList 中元素的等效“innerHTML”和“outerHTML”。
如何使用 org.w3c.dom API 获得 innerHTML 和 outerHTML 的等效项? (我不想引入另一个依赖,比如 JSoup)
最佳答案
inner/outerHTML只是方便的方法,它们本质上是通过 DOM 解析器和序列化程序将文档片段序列化到字符串或从字符串序列化。 您可以使用 DOM Load/Save APIs “步行”获得相同的结果。
参见 this answer如何使用它们。
关于java - 带有 org.w3c.dom API 的外部和内部 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28133157/