perl - LibXML findnodes($query)

标签 perl xpath libxml2

我在使用这段代码时遇到了一些问题:

my $file= '../xml/news.xml';
my $parser= XML::LibXML->new();
my $doc = $parser->parse_file($file);
my $xpc = XML::LibXML::XPathContext->new($doc);
my $query = '/notizie/news[@id='.$newsId.']';
print $query;
my $node = $xpc->findnodes($query)->get_node(1);

print $node;

特别是“print $node”会打印一个空字符串,即使 XML 文件路径正确且 XPath 查询应返回一个节点。

“有趣”的是,如果我使用:

my $query = '/*/*[@id='.$newsId.']'; 

我得到了正确的结果。

这是 news.xml 文件:

<?xml version="1.0"?>
<notizie xmlns="http://www.9armonie.com/news"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://www.9armonie.com/news news.xsd">
    <news id="3">
        <data>2015-01-01</data>
        <ora>12:00:00</ora>
        <titolo>Title 3</titolo>
        <descrizione> Description 3</descrizione>
    </news>     
    <news id="2">
        <data>2014-12-19</data>
        <ora>12:00:00</ora>
        <titolo>Title 2</titolo>
        <descrizione> Description 2</descrizione>
    </news>
    <news id="1">
        <data>2014-12-18</data>
        <ora>12:00:00</ora>
        <titolo>News 1</titolo>
        <descrizione> Desc 1</descrizione>
    </news>
    <news id="0">
        <data>2014-12-18</data>
        <ora>12:00:00</ora>
        <titolo> asdasd</titolo>
        <descrizione> First! </descrizione>
    </news>
</notizie>

最佳答案

您的输入 XML 文档位于默认命名空间中:

<notizie xmlns="http://www.9armonie.com/news"/>

该元素及其所有后代都在该命名空间中,并且像 //notizie 这样的表达式永远不会成功,因为它查找没有命名空间的元素。

另一方面,这也是 /*/* 返回元素的原因 - 因为 * 匹配任何(或不)命名空间中的元素。这真的没有什么好笑的。

要么在 Perl 代码中声明此命名空间(更好的选择),要么忽略 XPath 表达式中的命名空间。

使用 LibXML 声明命名空间

我相信在 LibXML 中声明命名空间是通过 registerNs() 完成的,请参阅 relevant CPAN page 。声明输入 XML 中的命名空间 URI 以及前缀(本例中为 news:),然后您可以使用它来限定 XPath 表达式中的元素名称。

my $xpc = XML::LibXML::XPathContext->new($doc);
$xpc->registerNs('news', 'http://www.9armonie.com/news');
my $query = '/news:notizie/news:news[@id='.$newsId.']';
my $node = $xpc->findnodes($query)->get_node(1);

忽略命名空间

第二个选项意味着将您的 XPath 表达式修改为

"/*[local-name() = 'notizie']/*[local-name() = 'news' and @id='.$newsId.']"

上述表达式将在以下所有文档中查找 notizie 元素:

<!--No namespace-->
<notizie/>

<!--Namespace with prefix-->
<news:notizie xmlns:news="http://www.9armonie.com/news"/>


<!--Default namespace-->
<notizie xmlns="http://www.9armonie.com/news"/>

关于perl - LibXML findnodes($query),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28203151/

相关文章:

perl - 使用 Perlbrew 时从 crontab 运行 Perl 脚本

perl - 如何解压 "pairwise reversed"命令BA DC中的字节?

perl - 如何在Perl中正确声明全局变量?

perl - DBIx::Class 中的子查询

xml - ., 在 XPath 中有什么用?

xpath - xpath 'or'与xmllib2的行为类似union ('|')

xml - 使用last函数的XPath谓词

python-3.x - Python3 和 xml/xslt 库

c# - 我可以将 libxml2 导入 Visual Studio 2013

c - 使用 libxml2 解析 xml 文件