我想获取整个网页的源代码,但是网站的某些内容一开始没有加载。(似乎与Ajax有关) 如何获取这些没有用java一次加载的内容?
我尝试使用 java 的 url.openStrem
。但这没有用。我只得到内容“loading...
”,而不是加载后的真实内容。
非常感谢。
最佳答案
您需要远程控制现有浏览器(使用 Java 并不容易,因为大多数使用其他语言/组件系统/界面)或使用可以执行 Javascript 的 headless 浏览器。 HTMLUnit属于后一类。
关于java - 如何用java获取网页的源代码?(如何处理延迟加载?),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13470689/