java - 从 Div 标签获取文本

标签 java jsoup html-parsing

我有一个主 Div 标签,其中包含多个 div 标签,如下所示。子 Div 标签没有与其他子 div 标签区分开的 class/id。现在我想从第二个子 Div 标签中提取文本值。我怎样才能做到这一点?

<div class="logFor" style="position: relative; height: 101px; padding: 5px;">
     <div style="color: #6b6b6b; font-weight: bold;">This is a monster</div>
     <div style="overflow: hidden; height: 28px; margin-top: 3px; color: #1b1f2e;">Monster in Black</div>
     <div style="position: absolute; left: 5px; bottom: 0;">
     <div style="position: absolute; right: 5px; bottom: 0;">
</div>

我想要获取文本“黑衣怪物”。这个 Div 没有 id/name,不确定这个样式是否相同或改变。我如何使用 jSoup 提取?

最佳答案

您可以使用以下代码来实现:

Document doc = Jsoup.parse(new File("test.html"), "utf-8");
Elements select = doc.select("div > div:eq(1)");
System.out.println(select.text());

另请查看此 javadoc有关选择器的详细信息

关于java - 从 Div 标签获取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9218246/

相关文章:

Python - 使用 Tidy 解析 HTML

python - 通过机器学习从网页中提取信息

java - Java 的 OpenMicroBlogging 库?

java - 使用 Java 和 Jaunt API 填写具有复杂名称(输入标签中的点符号)的 HTML 表单

java - 如何使用jsoup解析xhtml而不改变Html或解析Html实体

ios - HTML表格解析xcode

java - 哪个Java阻塞队列对于单生产者单消费者场景最有效

java - 忽略 SORT METHOD 中的符号

java - 无法根据某些条件对某些值进行分组

java - 为什么 Jsoup 无法连接某些 URL?