我使用lxml
来解析XML文档
如何获取声明字符串?
<?xml version="1.0" encoding="utf-8" ?>
我想检查它是否存在、它的编码方式以及 xml 版本。
最佳答案
解析文档时,生成的 ElementTree
对象应该有一个 DocInfo
对象,其中包含有关解析的 XML 或 HTML 文档的信息。
对于 XML,您可能对此 DocInfo
的 xml_version
和 encoding
属性感兴趣:
>>> from lxml import etree
>>> tree = etree.parse('input.xml')
>>> tree.docinfo
<lxml.etree.DocInfo object at 0x7f8111f9ecc0>
>>> tree.docinfo.xml_version
'1.0'
>>> tree.docinfo.encoding
'UTF-8'
关于python - 如何使用 lxml 获取 XML 声明字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48803562/