我正在使用 cElementTree
Python 中的模块来获取 XML
的文本子项树,使用 text
属性(property)。但它似乎只适用于直接文本子项(见下文)。
$ python
...
>>> import xml.etree.cElementTree as ET
>>> root = ET.XML('<root><elm key="value">Some text</elm>More text</root>')
>>> root.text
>>> root = ET.XML('<root>Text 1<elm key="value">Text</elm>Text 2<elm2 />Text 3</root>')
>>> root.text
'Text 1'
>>>
是否可以使用
['More text']
检索给定元素的所有直接文本子元素(可能作为列表,即 ['Text 1', 'Text 2', 'Text 3']
和 cElementTree
在上面的示例中)模块?
最佳答案
使用 xml.etree.ElementTree.Element.itertext
:
>>> import xml.etree.cElementTree as ET
>>> root = ET.XML('<root><elm key="value">Some text</elm>More text</root>')
>>> list(root.itertext())
['Some text', 'More text']
>>> root = ET.XML('<root>Text 1<elm key="value">Text</elm>Text 2<elm2 />Text 3</root>')
>>> list(root.itertext())
['Text 1', 'Text', 'Text 2', 'Text 3']
更新
要获得即时文本子项,您还需要访问
tail
子节点:>>> root = ET.XML('<root><elm key="value">Some text</elm>More text</root>')
>>> ([root.text] if root.text else []) + [child.tail for child in root]
['More text']
>>> root = ET.XML('<root>Text 1<elm key="value">Text</elm>Text 2<elm2 />Text 3</root>')
>>> ([root.text] if root.text else []) + [child.tail for child in root]
['Text 1', 'Text 2', 'Text 3']
关于python - 如何获取 cElementTree 中元素的所有文本子项?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34240818/