我用过这个Java NIO从 Google Direction 下载 xml 文件。
一个screenshot在 IE 中打开的 xml 文件。这是另一个screenshot它应该如何看起来正确。
由于某种原因, 标签似乎无法被识别,因此当我使用 xPath 评估和查询 XML 文件时,我得到如下输出:
Continue onto <b>Derwent St</b>
338
0.3 km
At the roundabout, take the <b>1st</b> exit onto <b>Corporation St</b>
102
0.1 km
有更简单的方法来解决这个问题还是我必须使用 SAX 解析器?
最佳答案
<b>
显示为数据而不是标签。它将表示为 <b>
或出现在 CDATA block 中。
即XML 包含 HTML 片段作为数据。它不包括命名空间 XHTML。
输出正是您所期望的。
接下来要做什么取决于您想要实现的目标。无论是什么,您都需要以字符串(而不是 textNode)的形式获取数据,并将该字符串视为 HTML,而不是文本。
如果你想查询 HTML,那么你需要先通过 HTML 解析器运行它。
关于java - 从 URL <b>/</b> 下载的 XML 文件无法识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14213589/