java - 从 URL / 下载的 XML 文件无法识别

我用过这个Java NIO从 Google Direction 下载 xml 文件。

一个screenshot在 IE 中打开的 xml 文件。这是另一个screenshot它应该如何看起来正确。

由于某种原因，标签似乎无法被识别，因此当我使用 xPath 评估和查询 XML 文件时，我得到如下输出:

Continue onto <b>Derwent St</b>

 338
 0.3 km

At the roundabout, take the <b>1st</b> exit onto <b>Corporation St</b>

 102
 0.1 km

有更简单的方法来解决这个问题还是我必须使用 SAX 解析器？

最佳答案

显示为数据而不是标签。它将表示为 或出现在 CDATA block 中。

即XML 包含 HTML 片段作为数据。它不包括命名空间 XHTML。

输出正是您所期望的。

接下来要做什么取决于您想要实现的目标。无论是什么，您都需要以字符串(而不是 textNode)的形式获取数据，并将该字符串视为 HTML，而不是文本。

如果你想查询 HTML，那么你需要先通过 HTML 解析器运行它。

关于java - 从 URL / 下载的 XML 文件无法识别，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14213589/

相关文章：

xml - 为什么 XSD 规范接受具有 -14H 的时区？

java - 从 URL <b>/</b> 下载的 XML 文件无法识别