我正在使用以下代码定位一个 div:
parser = etree.HTMLParser()
tree = etree.parse(StringIO(page), parser)
div = tree.xpath("//div[@class='content']")[0]
我唯一的问题是,在这样做之后我不想依赖 lxml 来提取所述 div 的内容:我只想取回 div 包含的原始 XML。这是可行的还是我必须完全放弃这种方法?
最佳答案
我想你正在寻找:
etree.tostring(div)
关于python - 如何从 lxml 获取原始 XML?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4006668/