xml - 仅使用 XPath 在 VTD-XML 中进行动态查找

标签 xml xpath vtd-xml

我正在尝试使用 XPath 表达式来查找引用 VTD-XML 中当前元素的元素。假设我的 XML 包含书籍和评级,如下所示:

<root>
  <book id="1" name="Book1"/>
  <book id="2" name="Book1"/>
  <rating book-id="1" value="5"/>
  <rating book-id="2" value="3"/>
</root>

首先,我将迭代所有书籍元素。然后,对于每本书,我想执行一个 XPath 表达式来获取该书的评级。例如:

/root/rating[@book-id=current()/@id]/@value

这不起作用,因为 current() 函数是 XSLT 独有的。所以我尝试将名为“current”的变量表达式声明为“.”。意思是“当前的书”,但这也不起作用,因为(顾名思义),变量表达式不存储表达式的结果,而是存储表达式本身。

有没有办法仅使用 XPath 表达式在 VTD-XML 中实现这种效果? (我意识到有多种方法可以在代码中执行此操作,但我想使用纯 XPath,以便用户可以轻松创建描述其数据格式的配置文件)

编辑: 接受的答案的结果是我想要的不能使用单个 XPath 表达式来完成。我最终添加了一个选项,以便用户基本上可以指定如何找到当前书籍的唯一标识符(即“./@id”,或者可能是“./isbn”)。然后,我的代码执行此表达式并将结果替换为评级搜索 XPath 中的某些占位符(例如“$$”)。

最佳答案

类似 //*/rating[./@book-id=//book/@id]/@value 的 XPath 表达式应该只检索与可用图书 ID 匹配的评级的评级值。

如果您添加<rating book-id="3" value="4"/>对于 XML 文档,XPath 将仅返回值 53对于书 1 和 2,因为没有 ID 为 3 的书可用。

使用 VTD 的简单测试方法可能如下所示:

@Test
public void xpathReference() throws Exception {
    byte[] bytes = ("<root>\n"
                 + "  <book id=\"1\" name=\"Book1\"/>\n"
                 + "  <book id=\"2\" name=\"Book1\"/>\n"
                 + "  <rating book-id=\"1\" value=\"5\"/>\n"
                 + "  <rating book-id=\"2\" value=\"3\"/>\n"
                 + "  <rating book-id=\"3\" value=\"4\"/>\n"
                 + "</root>").getBytes();

    VTDGen vtdGenerator = new VTDGen();
    vtdGenerator.setDoc(bytes);
    vtdGenerator.parse(true);
    VTDNav vtdNavigator = vtdGenerator.getNav();

    AutoPilot autoPilot = new AutoPilot(vtdNavigator);
    autoPilot.selectXPath("//*/rating[./@book-id=//book/@id]/@value");
    int id;
    int count = 0;
    while ((id = autoPilot.evalXPath()) != -1) {
        String elementName = vtdNavigator.toString(id);
        int text = vtdNavigator.getAttrVal(elementName);
        String txt = text != -1 ? vtdNavigator.toNormalizedString(text) : "";
        System.out.println("Found match at ID " + id + " in field name '" + elementName + "' with value '" + txt + "'");
        count++;
    }
    System.out.println("Total number of matches: " + count);
    assertThat(count, is(equalTo(2)));
}

执行此测试方法时,您应该会看到与此类似的输出:

Found match at ID 15 in field name 'value' with value '5'
Found match at ID 20 in field name 'value' with value '3'
Total number of matches: 2

根据评论,上面的代码没有以类似迭代的方式提取当前处理的书籍的数据。下面的代码现在尝试实现此目的:

@Test
public void xpathReference() throws Exception {
    byte[] bytes = ("<root>\n"
                    + "  <book id=\"1\" name=\"Book1\"/>\n"
                    + "  <book id=\"2\" name=\"Book2\"/>\n"
                    + "  <book id=\"4\" name=\"Book3\"/>\n"
                    + "  <rating book-id=\"1\" value=\"5\"/>\n"
                    + "  <rating book-id=\"2\" value=\"3\"/>\n"
                    + "  <rating book-id=\"3\" value=\"4\"/>\n"
                    + "</root>").getBytes();

    VTDGen vtdGenerator = new VTDGen();
    vtdGenerator.setDoc(bytes);
    vtdGenerator.parse(true);
    VTDNav vtdNavigator = vtdGenerator.getNav();

    AutoPilot autoPilot = new AutoPilot(vtdNavigator);
    autoPilot.selectXPath("//book/@id");
    int id;
    int count = 0;
    while ((id = autoPilot.evalXPath()) != -1) {
        String elementName = vtdNavigator.toString(id);
        int bookId_id = vtdNavigator.getAttrVal(elementName);
        String bookId = bookId_id != -1 ? vtdNavigator.toNormalizedString(bookId_id) : "";

        AutoPilot xpathBookName = new AutoPilot(vtdNavigator);
        xpathBookName.selectXPath("//book[@id=" + bookId + "]/@name");
        String bookName = xpathBookName.evalXPathToString();

        AutoPilot xpathRating = new AutoPilot(vtdNavigator);
        xpathRating.selectXPath("//rating[@book-id=" + bookId + "]/@value");
        String bookRating = xpathRating.evalXPathToString();

        if ("".equals(bookRating)) {
            System.out.println("Book " + bookName + " with id " + bookId + " has no rating yet");
        } else {
            System.out.println("Book " + bookName + " with id " + bookId + " has a rating of " + bookRating);
        }
        count++;
    }
    System.out.println("Total number of matches: " + count);
    assertThat(count, is(equalTo(3)));
}

如果执行后一个代码,您应该看到如下输出:

Book Book1 with id 1 has a rating of 5
Book Book2 with id 2 has a rating of 3
Book Book3 with id 4 has no rating yet
Total number of matches: 2

请注意,我确实稍微更新了您的第二本书的名称,以便您可以更轻松地看到差异。


... and yes, it is easy to just get the id of the current book in Java code and then construct an XPath expression with that, but as I explained, I want the user to be able to use XPath to define their document format, so I don't want any format-specific stuff in the code

VTD 仅支持 XPath 1.0。如果您(或您的客户)能够提出 XPath 1.0 查询,您也应该能够通过 VTD 提取相应的值。我想,普通的 XPath 查询的表达能力不足以直接提供您需要的内容。

由于该示例对于您所需的用例来说可能过于简单,因此很难就如何设计应用程序来处理此类场景提供任何建议。也许用更详细的示例更新您的问题。处理此问题的一种简单方法是引入必须单独定义的占位符变量,然后在尝试执行此类 XPath 表达式时命中此类占位符时,只需将这些占位符替换为之前提取的值的具体值。

关于xml - 仅使用 XPath 在 VTD-XML 中进行动态查找,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45191706/

相关文章:

C# 对 XElement 进行排序,带注释

java - 在 Java StAX 解析器中编码

html - 使用xidel提取键值对

php - 在 php 中使用 simplexml 从 plist 样式的 xml 获取键/值对

java - com.ximpleware 解析 XML - XPath - ==> 末尾或附近的语法错误

java - 在java中使用vtd-xml获取xml中的属性文本

java - 滚动不起作用时工具栏自动隐藏和显示

java - 转义xml中的特殊字符

xml - 使用 xml_split 根据 Perl 正则表达式或 XPath 表达式拆分 XML 文件

java - 使用 VTD-XML 的带有 & 符号的 XML 文件的 ParserException