我必须像这样解析 HTML
<span class="legenda">Cargo a que concorre:</span> Vereador<br />
<span class="legenda">Nome para urna:</span> Adeilza<br />
<span class="legenda">Número:</span> 40656<br />
<span class="legenda">Estado:</span> Amapá<br />
<span class="legenda">Município:</span> Vitória do Jari<br />
<span class="legenda">Partido:</span> Partido Socialista Brasileiro - PSB<br />
<span class="legenda">Coligação:</span> Vitória para todos (PSB / PV / PRTB)<br />
我正在使用 jsoup 来解析并遵循示例,但我不知道在这种情况下如何获取之后的值。例如“Vereador”或“Adeilza”。 有没有办法用 jsoup 做到这一点?
如果有人想查看所有 html 页面,这里是链接。 查看源代码:http://www.eleicoes2012.info/adeilza-psb-40656/
最佳答案
在 jSoup Element
上调用 nextSibling
将为您提供它找到的下一个 Node
。在这种情况下,您可以将 span
元素的选择器与 legenda
类一起使用,然后调用 nextSibling
。简单示例:
Document doc = Jsoup.connect("http://www.eleicoes2012.info/adeilza-psb-40656/").get();
Elements spans = doc.select("span.legenda");
for(Element span: spans) {
System.out.println(span.nextSibling());
}
为我生成此输出:
Adeilza Ribeiro de Souza 30 anos (09/08/1983) Almeirim/PA Solteiro(A) Dona de Casa Ensino Fundamental Incompleto 0 Votos Vereador Adeilza 40656 Amapá Vitória do Jari Partido Socialista Brasileiro - PSB Vitória para todos (PSB / PV / PRTB)
关于java - Jsoup/Java - 如何提取不在标签内的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21806768/