java - Jsoup/Java - 如何提取不在标签内的数据

标签 java html tags jsoup

我必须像这样解析 HTML

<span class="legenda">Cargo a que concorre:</span> Vereador<br />
<span class="legenda">Nome para urna:</span> Adeilza<br />
<span class="legenda">Número:</span> 40656<br />
<span class="legenda">Estado:</span> Amapá<br />
<span class="legenda">Município:</span> Vitória do Jari<br />
<span class="legenda">Partido:</span> Partido Socialista Brasileiro - PSB<br />
<span class="legenda">Coligação:</span> Vitória para todos (PSB / PV / PRTB)<br />

我正在使用 jsoup 来解析并遵循示例,但我不知道在这种情况下如何获取之后的值。例如“Vereador”或“Adeilza”。 有没有办法用 jsoup 做到这一点?

如果有人想查看所有 html 页面,这里是链接。 查看源代码:http://www.eleicoes2012.info/adeilza-psb-40656/

最佳答案

在 jSoup Element 上调用 nextSibling 将为您提供它找到的下一个 Node。在这种情况下,您可以将 span 元素的选择器与 legenda 类一起使用,然后调用 nextSibling。简单示例:

Document doc = Jsoup.connect("http://www.eleicoes2012.info/adeilza-psb-40656/").get();
Elements spans = doc.select("span.legenda");

for(Element span: spans) {
    System.out.println(span.nextSibling());
}

为我生成此输出:

Adeilza Ribeiro de Souza
30 anos (09/08/1983)
Almeirim/PA
Solteiro(A)
Dona de Casa
Ensino Fundamental Incompleto

 0 Votos
 Vereador
 Adeilza
 40656
 Amap&aacute;
 Vit&oacute;ria do Jari
 Partido Socialista Brasileiro - PSB
 Vit&oacute;ria para todos (PSB / PV / PRTB)

关于java - Jsoup/Java - 如何提取不在标签内的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21806768/

相关文章:

java - 替换过时的 `Hashtable` 集合

java - Spring 启动: @PreAuthorize gives 403 forbidden AccessDeniedException

php - 我的网站登录过程遇到问题

javascript - 在 Twitter Typeahead.js 中获取 Remote 返回的数据集

java - java中如何在不使用标签名称的情况下提取xml标签值?

java - 如何获取结果集中WHERE条件求值的结果?

Java - 如何从 Android 中的 azure 移动服务检索和使用单个值

javascript - 使特定元素在悬停时改变位置

html - Favicon 未显示在 Google Chrome 浏览器中

jquery-ui - 使用 jquery 在文本区域中创建标签