python - 如何从 lxml 树中剥离 namespace ?

标签 python xml lxml xml-namespaces prefix

Removing child elements in XML using python 开始...

感谢@Tichodroma,我有这段代码:

如果可以使用lxml ,试试这个:

 import lxml.etree

 tree = lxml.etree.parse("leg.xml")
 for dog in tree.xpath("//Leg1:Dog",
                       namespaces={"Leg1": "http://what.not"}):
     parent = dog.xpath("..")[0]
     parent.remove(dog)
     parent.text = None
 tree.write("leg.out.xml")

现在 leg.out.xml 看起来像这样:

 <?xml version="1.0"?>
 <Leg1:MOR xmlns:Leg1="http://what.not" oCount="7">
   <Leg1:Order>
     <Leg1:CTemp id="FO">
       <Leg1:Group bNum="001" cCount="4"/>
       <Leg1:Group bNum="002" cCount="4"/>
     </Leg1:CTemp>
     <Leg1:CTemp id="GO">
       <Leg1:Group bNum="001" cCount="4"/>
       <Leg1:Group bNum="002" cCount="4"/>
     </Leg1:CTemp>
   </Leg1:Order>
 </Leg1:MOR>

如何修改我的代码以从所有元素的标签名称中删除 Leg1: 命名空间前缀?

最佳答案

从每个元素中删除 namespace 前缀的一种可能方法:

def strip_ns_prefix(tree):
    #iterate through only element nodes (skip comment node, text node, etc) :
    for element in tree.xpath('descendant-or-self::*'):
        #if element has prefix...
        if element.prefix:
            #replace element name with its local name
            element.tag = etree.QName(element).localname
    return tree

另一个版本在 xpath 中检查命名空间而不是使用 if 语句:

def strip_ns_prefix(tree):
    #xpath query for selecting all element nodes in namespace
    query = "descendant-or-self::*[namespace-uri()!='']"
    #for each element returned by the above xpath query...
    for element in tree.xpath(query):
        #replace element name with its local name
        element.tag = etree.QName(element).localname
    return tree

关于python - 如何从 lxml 树中剥离 namespace ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30232031/

相关文章:

xml - 如何用另一个通用文本的内容替换 XML 元素的文本内容?

python - 使用 lxml 部分丢失元素的文本内容

python - 使用lxml从python中的xml中删除命名空间和前缀

python - 删除 lxml 控制字符

python - 如何使用 Go 和 Python 处理 YAML 中的十六进制值?

python - 重新分配 Pandas DataFrame 列中的条目

python - 具有相同参数的函数的全局变量与参数

php - 将美国置于 phpfox 注册页面上国家列表的顶部

php - 检索和解析与 MySQL 结果相关的 XML 记录

python - AWS Boto/Warrant 库 : SRP authentication and credentials error