python - 使用 ElementTree 从 XML 中提取数据时出现问题

标签 python xml api rest elementtree

我无法理解如何从以下 XML 文档中提取数据。

我通过 ECB API 下载了 XML 文档.

import urllib.request

access_url = 'https://sdw-wsrest.ecb.europa.eu/service/data/EXR/D.USD.EUR.SP00.A?startPeriod=2000-01-01&endPeriod=2015-12-10'
response = urllib.request.urlretrieve(access_url, 'trial_savename.xml')

它检索并保存如下所示的 XML 文档(显示前 37 行):

<?xml version="1.0" encoding="UTF-8"?><message:GenericData xmlns:message="http://www.sdmx.org/resources/sdmxml/schemas/v2_1/message" xmlns:common="http://www.sdmx.org/resources/sdmxml/schemas/v2_1/common" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:generic="http://www.sdmx.org/resources/sdmxml/schemas/v2_1/data/generic" xsi:schemaLocation="http://www.sdmx.org/resources/sdmxml/schemas/v2_1/message https://sdw-wsrest.ecb.europa.eu:443/vocabulary/sdmx/2_1/SDMXMessage.xsd http://www.sdmx.org/resources/sdmxml/schemas/v2_1/common https://sdw-wsrest.ecb.europa.eu:443/vocabulary/sdmx/2_1/SDMXCommon.xsd http://www.sdmx.org/resources/sdmxml/schemas/v2_1/data/generic https://sdw-wsrest.ecb.europa.eu:443/vocabulary/sdmx/2_1/SDMXDataGeneric.xsd">
<message:Header>
<message:ID>781631bf-c21e-4c88-9657-ae03c858b917</message:ID>
<message:Test>false</message:Test>
<message:Prepared>2015-12-11T16:56:20.723+01:00</message:Prepared>
<message:Sender id="ECB"/>
<message:Structure structureID="ECB_EXR1" dimensionAtObservation="TIME_PERIOD">
<common:Structure>
<URN>urn:sdmx:org.sdmx.infomodel.datastructure.DataStructure=ECB:ECB_EXR1(1.0)</URN>
</common:Structure>
</message:Structure>
</message:Header>
<message:DataSet action="Replace" validFromDate="2015-12-11T16:56:20.723+01:00" structureRef="ECB_EXR1">
<generic:Series>
<generic:SeriesKey>
<generic:Value id="FREQ" value="D"/>
<generic:Value id="CURRENCY" value="USD"/>
<generic:Value id="CURRENCY_DENOM" value="EUR"/>
<generic:Value id="EXR_TYPE" value="SP00"/>
<generic:Value id="EXR_SUFFIX" value="A"/>
</generic:SeriesKey>
<generic:Attributes>
<generic:Value id="SOURCE_AGENCY" value="4F0"/>
<generic:Value id="COLLECTION" value="A"/>
<generic:Value id="DECIMALS" value="4"/>
<generic:Value id="TITLE_COMPL" value="ECB reference exchange rate, US dollar/Euro, 2:15 pm (C.E.T.)"/>
<generic:Value id="UNIT" value="USD"/>
<generic:Value id="TITLE" value="US dollar/Euro"/>
<generic:Value id="UNIT_MULT" value="0"/>
</generic:Attributes>
<generic:Obs>
<generic:ObsDimension value="2000-01-03"/>
<generic:ObsValue value="1.009"/>
<generic:Attributes>
<generic:Value id="OBS_STATUS" value="A"/>
</generic:Attributes>
</generic:Obs>

我想提取每个 ObsDimension 值ObsValue 值 并继续使用这些值。

我尝试按以下方式使用ElementTree:

import xml.etree.ElementTree as ET
tree = ET.parse('trial_savename.xml')
e = tree.findall('message:GenericData')

返回一个空列表[]。我以为我可以像这样 e = tree.findall('message:GenericData/message:DataSet/generic:Series/generic:Obs/generic:ObsDimension value') 访问数据,但事实并非如此似乎是这样做的方法。

我错了什么?

最佳答案

您需要传递命名空间参数。

>>> import xml.etree.ElementTree as ET
>>> tree = ET.parse('trial_savename.xml')
>>> ns = {'generic': "http://www.sdmx.org/resources/sdmxml/schemas/v2_1/data/generic" }
>>> dimensions = tree.findall('.//generic:ObsDimension', namespaces=ns)
>>> values = [dim.get('value') for dim in dimensions]
>>> values[:5]
['2000-01-03', '2000-01-04', '2000-01-05', '2000-01-06', '2000-01-07']

如果您使用lxml ,您可以使用 nsmap 属性,以及 xpath method :

>>> import lxml.etree as ET
>>> tree = ET.parse('trial_savename.xml')
>>> values = tree.xpath('.//generic:ObsDimension/@value', namespaces=tree.getroot().nsmap)
>>> values[:5]
['2000-01-03', '2000-01-04', '2000-01-05', '2000-01-06', '2000-01-07']

关于python - 使用 ElementTree 从 XML 中提取数据时出现问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34228551/

相关文章:

java - 如何在屏幕尺寸变化时动态管理TextViews的位置

javascript - 需要帮助了解如何使用 Twitter 的 @anywhere is Follow/Followed By 方法

python - 账户工具包 : Error verifying the token in the 'access_token'

Python - 当行索引和列都是类别时数据帧值的散点图

python - 为什么 GHC 测试套件是用 Python 而不是 Haskell 编写的?

python - 应用函数仅适用于一列而不是多列?

python - 从 Python 中编译的正则表达式中提取命名组正则表达式模式

java - 使用 Camel 将 XML 转为 Json

python - 有没有办法将 XML 转换为字典和列表?

javascript - 如何将数据从一个ejs文件发送到另一个ejs文件