java - JSoup文档结构问题

标签 java html jsoup

尝试以下操作......

String rq = "http://www.musicbrainz.org/ws/2/release/ac1afa8d-1a86-4435-9714-0a5e808e4c83?inc=recordings";<br></br>
Document doc = Jsoup.connect(rq).get();

您可以在浏览器中看到轨道的结构如下...

<track><br></br>
    <position>1</position><br></br>
    <length>249000</length><br></br>
    <recording><br></br>
    <title>Hello</title><br></br>
    <length>249000</length><br></br>
    </recording><br></br>
 </track&gt;<br></br>

但是如果您查看文档,它已被重组为...

<track></track><br></br>
<position>1</position><br></br>
<length>249000</length><br></br>
<recording><br></br>
   <title>Hello</title><br></br>
   <length>249000</length><br></br>
</recording><br></br>

知道发生了什么吗? (使用jsoup-1.6.1.jar)
谢谢!

最佳答案

我相信这是因为您正在解析的文档是 XML 而不是 HTML。 Jsoup 主要是一个 HTML 解析器。

关于java - JSoup文档结构问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9472169/

相关文章:

java - 缓存 Set 时最好的标识符是什么? Set的hashCode计算什么时候发生?

java - JUnit 中如何处理超时?

java - 有没有办法使for循环中的循环增加随机化?

java - 如何在 JSOUP 中获取显示/视觉图像大小(而不是实际图像大小)?

java - 使用 Jsoup 选择没有类的 HTML 元素

java - ConcurrentHashMap - 奇怪的行为

javascript - 如何清除:target choice?

javascript - getElementById 无法获取 html id 的值

html 和 css - 在不使用表格的情况下对齐文章的行和列

java - 从 html 解析器获取元素