java - 一些帮助用 Java 抓取页面

标签 java html xhtml screen-scraping

我需要使用 Java 抓取网页,我了解到正则表达式是一种非常低效的方法,应该将其放入 DOM 文档中进行导航。

我已经尝试阅读文档,但它似乎过于广泛,我不知道从哪里开始。

你能告诉我如何抓取 this 吗?表到一个数组?我可以尝试从那里找出我的出路。片段/示例也可以。

谢谢。

最佳答案

你可以试试jsoup: Java HTML Parser .这是一个优秀的库,具有很好的示例代码。

关于java - 一些帮助用 Java 抓取页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4576822/

相关文章:

java - 在 birt 中创建组并分析数组列表中的数据

hibernate - 如何在序列化过程中限制hibernate相关对象

java - 如何在jsp中显示包含从数据库返回的所有行的html表?

html - 使 Div 宽度响应

javascript - 设计一个专业的网站

java - XHTML 到 java 转换的最佳方法

java - 安卓游戏开发结构

java - 如何在Keycloak身份验证之前调用javax.servlet.Filter

javascript - 当我从模式中选择"is"选项时如何取消选中复选框?

asp.net - 有没有一种方法可以在输出到 HTML 时保留我为 asp .net 控件设置的 id?