java - 从 URL <b>/</b> 下载的 XML 文件无法识别

标签 java xml xpath google-directions-api

我用过这个Java NIO从 Google Direction 下载 xml 文件。

一个screenshot在 IE 中打开的 xml 文件。这是另一个screenshot它应该如何看起来正确。

由于某种原因, 标签似乎无法被识别,因此当我使用 xPath 评估和查询 XML 文件时,我得到如下输出:

Continue onto <b>Derwent St</b>

 338
 0.3 km

At the roundabout, take the <b>1st</b> exit onto <b>Corporation St</b>

 102
 0.1 km

有更简单的方法来解决这个问题还是我必须使用 SAX 解析器?

最佳答案

<b>显示为数据而不是标签。它将表示为 &lt;b&gt;或出现在 CDATA block 中。

即XML 包含 HTML 片段作为数据。它不包括命名空间 XHTML。

输出正是您所期望的。

接下来要做什么取决于您想要实现的目标。无论是什么,您都需要以字符串(而不是 textNode)的形式获取数据,并将该字符串视为 HTML,而不是文本。

如果你想查询 HTML,那么你需要先通过 HTML 解析器运行它。

关于java - 从 URL <b>/</b> 下载的 XML 文件无法识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14213589/

相关文章:

xml - 为什么 XSD 规范接受具有 -14H 的时区?

java - 卢塞恩搜索

java - Springboot2和oauth

java - 在Java中使用xpath解析由多个xml文件组成的xml字符串

java - 当我使用 Selenium IDE 时,WebDriver 无法找到 WebElement,其中相同的 css 工作正常

java - 使用 XPath 搜索和检索 XML 中的属性

java - java程序的编译和执行?

java - 属性文件中的属性键名称

java - 如何让应用程序在第一次启动时打开不同的 Activity,并在以后打开不同的 Activity?

xml - 在 XSLT 模板中求和总计时出现问题