python - python lxml 的 DOMDocument 接口(interface)

标签 python dom html-parsing lxml

我编写了一个小型应用程序,需要访问底层 HTML 页面的 DOM 表示形式。 Lxml 真的很棒,但我一直没能找到这样的接口(interface)。有人知道是否存在或是否有其他工具可以做到这一点?

最佳答案

According to the lxml documentation , 可以使用 lxml 来解析文档,它的 SAX 解析器可以与 Python xml.dom.pulldom 模块接口(interface)以创建 DOM 对象。根据文档,代码可能如下所示:

from xml.dom.pulldom import SAX2DOM
handler = SAX2DOM()
lxml.sax.saxify(tree, handler)
dom = handler.document

关于python - python lxml 的 DOMDocument 接口(interface),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7876287/

相关文章:

javascript - 使用 javascript 加载 css 文件

c++ - htmlcxx0.84编译错误

python - Beautiful Soup and Table Scraping - lxml 与 html 解析器

python - 随机选择字符串中的元素百分比并更改值

python - 如何将 exe 转换回 Python 脚本

javascript - 获取 iframe 的文档对象

javax.xml.transform.TransformerException : java. io.FileNotFoundException:<file_name>(访问被拒绝)

php - 维基百科使用哪种维基标记解析器?

python - 如何找到椭圆的方程式

python - pip 中的 --pre 选项是什么意思?