java - 如何用java获取网页的源代码?(如何处理延迟加载?)

标签 java ajax html scribe

我想获取整个网页的源代码,但是网站的某些内容一开始没有加载。(似乎与Ajax有关) 如何获取这些没有用java一次加载的内容?

我尝试使用 java 的 url.openStrem。但这没有用。我只得到内容“loading...”,而不是加载后的真实内容。

非常感谢。

最佳答案

您需要远程控制现有浏览器(使用 Java 并不容易,因为大多数使用其他语言/组件系统/界面)或使用可以执行 Javascript 的 headless 浏览器。 HTMLUnit属于后一类。

关于java - 如何用java获取网页的源代码?(如何处理延迟加载?),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13470689/

相关文章:

javascript - 滚动后无法更改某些元素样式

html - 有没有一种跨浏览器的方法可以使图像缩小以适合?

java - Jasper Reports 第一次调用每个报告时速度非常慢

java - HashMap.java源代码

java - 使用 Raster 创建图像时出现 ArrayIndexOutOfBoundsException

javascript - Tumblr API : 'Cannot read property ' alt_sizes' of undefined'

java - Java 中的 "Constructor call must be the first statement in a constructor"问题

javascript - 在 beforeSend ajax 上禁用按钮链接

javascript - jQuery Ajax - 失败的资源或 Uncaught Error

jquery - 为引导导航栏和照片添加半透明,并增加字体大小