我想使用 JAVA 从网站中提取 HTML 数据。问题是,一旦用户到达页面底部,网页就会不断向下滚动。向下滚动的次数是固定的。我的JAVA代码只能提取第一部分。剩下的卷轴如何提取?有没有办法用JAVA一次加载整个页面?任何帮助将不胜感激:)
最佳答案
这可能就是 PhantomJS (http://phantomjs.org/) 的设计目的。它会在 headless 模式下使用“真正的”浏览器抓取整个网页,甚至执行 JavaScript。我建议停止使用 Java 所做的事情,转而看看 PhantomJS。它可以节省你很多时间。 :)
关于java - 如何从向下滚动固定次数的网页中提取HTML数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11231779/