java - JSoup 获取 div 的第一个子元素

标签 java parsing jsoup

我正在尝试使用 JSoup 解析如下所示的结构.

<div class="bigClass">
    <a href="foo.com"> Field 1</a>
    <a href="bar.com"> Field 2</a>
    <a href="baz.com"> Field 3</a>
</div>

现在,我正在使用以下代码来获取div类“bigClass”的全部文本内容

doc = Jsoup.connect("http://foobar.com").userAgent(userAgent).timeout(1000).get();
price = doc.getElementsByClass("bigClass");
System.out.println(price.text());

无论<a>如何,我怎样才能只获得第一个 child (“字段1”)类和 URL?

BeautifulSoup python 的类似问题:Beautiful soup getting the first child

最佳答案

你可能正在寻找我

doc.getElementsByClass("bigClass").first().child(0)
  • getElementsByClass("bigClass") 返回所有具有 bigClass 的元素
  • 但我们想要得到具体的一个(可能是第一个)
  • 并在第一个元素上选择其第一个子节点(子节点的索引从 0 开始)。

关于java - JSoup 获取 div 的第一个子元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34485372/

相关文章:

java - JSP/MySQL - 格式化不

java - 如何使 java 对象在 Flex 中的 Sub mxml 到 Main mxml 文件中可见?

Java 邮件和数据库连接发生冲突

parsing - 修复 Bison 语法中的移位/减少冲突

java - Jsoup URL.get()/post() 内存不足错误

java - 如何在 fragment View 中添加 admob 横幅?

parsing - 在解析过程中划分不同类型的术语

c - 解析具有多个公共(public)分隔符的文件 C

java - 套接字超时异常 : Read timed out

java - Jsoup 在标记后选择文本