我需要使用 Java 抓取网页,我了解到正则表达式是一种非常低效的方法,应该将其放入 DOM 文档中进行导航。
我已经尝试阅读文档,但它似乎过于广泛,我不知道从哪里开始。
你能告诉我如何抓取 this 吗?表到一个数组?我可以尝试从那里找出我的出路。片段/示例也可以。
谢谢。
最佳答案
你可以试试jsoup: Java HTML Parser .这是一个优秀的库,具有很好的示例代码。
关于java - 一些帮助用 Java 抓取页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4576822/