Java-Jsoup,抓取 html

标签 java html web-scraping jsoup

我正在使用 Jsoup 和 Java 来解析 HTML 文件。我的问题是如何提取“每小时费率:23,016 个订单”这一行 我正在解析很多文件,因此每小时费率旁边的数字将会改变。

<html>
<head>
<title>Testing</title>
</head>
<body>
<p class=MsoNormal align=center style='background:#DEDEDF'>
<span style='font-size:18.0pt'><b>Testing</b></span></p>
Hourly Rate: 23,016 orders<br>
<table border=0 cellpadding=0>
<tr valign=top>
<td>

谢谢

最佳答案

我刚刚添加了这段代码:

 String HourlyRate = doc.body().ownText();
//String text = doc.body().text();

System.out.println(HourlyRate);

打印出来的: 每小时费率:23,016 个订单

关于Java-Jsoup,抓取 html,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17148329/

相关文章:

java - 如何验证用户在 Java 中输入的是整数还是字母字符?

java - 从数据库中获取最后一个索引的重复数据,而不是 Java 中的所有数据

html - Chrome/webkit 的奇怪错误。随机大小变化

html - 多语言网站翻译的局限性

Python在线抓取数据,但csv文件未显示正确的数据格式

java - 为什么我没有得到字符串格式的输出?

javascript - 在固定元素上使用 fullpagejs 滚动

python - 我想提取成员(member)链接

c# - 如何使用 C# 从 html 页面中抓取文本?

java - 我的 Java 程序没有打印我对 MySQL 进行的查询的结果