我编写了一个小型应用程序,需要访问底层 HTML 页面的 DOM 表示形式。 Lxml 真的很棒,但我一直没能找到这样的接口(interface)。有人知道是否存在或是否有其他工具可以做到这一点?
最佳答案
According to the lxml documentation , 可以使用 lxml 来解析文档,它的 SAX 解析器可以与 Python xml.dom.pulldom 模块接口(interface)以创建 DOM 对象。根据文档,代码可能如下所示:
from xml.dom.pulldom import SAX2DOM
handler = SAX2DOM()
lxml.sax.saxify(tree, handler)
dom = handler.document
关于python - python lxml 的 DOMDocument 接口(interface),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7876287/