python - 如何从 lxml 获取原始 XML?

标签 python xml html-parsing lxml

我正在使用以下代码定位一个 div:

parser = etree.HTMLParser()
tree = etree.parse(StringIO(page), parser)

div = tree.xpath("//div[@class='content']")[0]

我唯一的问题是,在这样做之后我不想依赖 lxml 来提取所述 div 的内容:我只想取回 div 包含的原始 XML。这是可行的还是我必须完全放弃这种方法?

最佳答案

我想你正在寻找:

etree.tostring(div)

关于python - 如何从 lxml 获取原始 XML?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4006668/

相关文章:

Python:如何构建具有多个滑动字符串的字典

Python 与子字符串的交集

java - Hibernate XML - 具有一对一映射的复合 ID

sql 设置 xml 值

python - 将 HTML 表放入 pandas Dataframe,而不是 dataframe 对象列表

Python 链接抓取器

python - Python 中的单行和多行循环和矢量化

Python - 将列表范围设置为特定值

python - Flask peewee 无法在网络服务器上工作

xml - 在我的 VB6 项目中引用哪个版本的 Microsoft XML (msxml?.dll)