python - 如何使用 lxml 获取 XML 声明字符串

标签 python xml lxml

我使用lxml来解析XML文档 如何获取声明字符串?

 <?xml version="1.0" encoding="utf-8" ?> 

我想检查它是否存在、它的编码方式以及 xml 版本。

最佳答案

解析文档时,生成的 ElementTree 对象应该有一个 DocInfo 对象,其中包含有关解析的 XML 或 HTML 文档的信息。

对于 XML,您可能对此 DocInfoxml_versionencoding 属性感兴趣:

>>> from lxml import etree
>>> tree = etree.parse('input.xml')
>>> tree.docinfo
<lxml.etree.DocInfo object at 0x7f8111f9ecc0>
>>> tree.docinfo.xml_version
'1.0'
>>> tree.docinfo.encoding
'UTF-8'

关于python - 如何使用 lxml 获取 XML 声明字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48803562/

相关文章:

python - 下载NLTK数据时出错: [Errno 11004] getaddrinfo failed

python - 为什么相同数据的 scipy.stats.gaussian_kde() 比 seaborn.kde_plot() 慢?

c - opencv保存文件xml

python - mousepress事件的问题

python - 如何在 python 中使用@..以及@property 和@classmethod

java - 尝试建立本地连接时出错

xml - 是否有任何允许指定约束(如无循环引用)的 XML 模式语言?

python - 解析具有未定义实体的 XHTML5

python - 如何使用 lxml 在 XHTML 文档中查找元素文本

python - 使用 lxml 在 Python 中漂亮地格式化 xml 文件