xml - 使用 Perl 和 XML::Twig 解析 XML - 进一步提取嵌套子项

标签 xml perl xml-twig

目前正在尝试弄清楚如何最好地处理以下示例 XML 数据:

<FOO>
    <A>1</A>
    <B>Some Stuff</B>
    <C>
      <C1>
        <C2A><![CDATA[xxx]]></C2A>
        <C2B><![CDATA[yyy]]></C2B>
      </C1>
    </C>
</FOO>

我目前正在使用 XML::Twig 来操作其他一切,我想继续使用这个模块来实现我的目标,即:

从 C2A 和 C2B 中提取数据,并将它们分配给变量。请注意,C2A 和 C2B 可能有多个条目,例如需要将它们连接成一个@array。但是,我的问题是向下导航树,例如,如果我们按照我发现的另一个示例进行操作,那么对于这些​​数据来说这就足够了:

<MOVIE_LIST>
    <MOVIE>
        <NAME>Name of the Movie</NAME>
            <MOVIE_ID>28372382</MOVIE_ID>
        <DESCRIPTIONS>
             <LONG_DESCRIPTION>This is a long description</LONG_DESCRIPTION>
             <SHORT_DESCRIPTION>short description</SHORT_DESCRIPTION>
        </DESCRIPTIONS>
        <DIRECTOR_LIST>
            <DIRECTOR>director 1</DIRECTOR>
            <DIRECTOR>director 2</DIRECTOR>
        </DIRECTOR_LIST>
    </MOVIE>
    <MOVIE>
      ...
     </MOVIE>
</MOVIE_LIST>

解决方案是: @directors = $elt->first_child('DIRECTOR_LIST')->children_text('DIRECTOR');

但是,我的问题是,有时这些 child 并不存在(例如,根本没有发送剖腹产数据),这让我感到无休止的悲伤,因为像下面这样的事情是行不通的:

@C = $elt->first_child('C')->first_child('C1')->children_text('C2');

我对如何实现我的目标感到相当困惑,非常感谢任何建议,欢迎简单的答案;-)

最佳答案

如果其中一个方法没有找到 child ,那么它将返回 undef,当然你不能在其上调用方法。

所以你有两个选择:

您可以测试链式表达式的每个步骤:

@C =    $elt->first_child('C') 
     && $elt->first_child('C')->first_child('C1')
     && $elt->first_child('C')->first_child('C1')->children_text('C2')
     || ()
    ;

或使用 XPath:

@C= map { $_->text } $elt->findnodes( './C/C1/C2');

第二个选项可能更易于阅读和维护。

关于xml - 使用 Perl 和 XML::Twig 解析 XML - 进一步提取嵌套子项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7432145/

相关文章:

java - 读取 XML 文件

c# - 打开 XML 文件并将其转换为 UTF-8

python - 为什么在一个脚本中两次调用 ElementTree.parse 函数会出现异常?

php - 使用 PHP(或可能是 perl)将 PDF 文档拆分为单独的页面

perl - $twig->purge 给出空文件

Android:将按钮文本移至底部

php - 从 PHP 调用 Perl 脚本并传入变量,同时还使用可变的 perl 脚本名称

Perl 类::dbi - 多个连接

XML::Twig 使用正则表达式匹配处理程序标记 (perl v5.30.3 XML Twig v3.52)

xml - 如何加速 XML::Twig