我创建了一个简单的 Java 脚本,它使用 Jsoup 来解析数据页。然而,网站创建者已经更改了页面,以至于如果页面上有一定量的数据,它会给您提供优化搜索的意见,或者,您可以单击链接,数据就会出现。我一直在绞尽脑汁地寻找解决方案,网址没有改变,链接的 href 只是 javacript:void(0);
。有什么方法可以仅使用我的脚本获取包含数据的 html 吗?
最佳答案
尝试使用类似 Selenium 之类的驱动网络浏览器的东西。这是我唯一用过的,从来不需要其他任何东西。我确信有不同的可能更适合您,您应该测试一些,或者不测试。一旦您使用 selenium(或您选择的任何 Web 驱动程序)获取 javascript 元素,请将它们解析为 JSoup 元素。 这样您就不必完全更改库,而只需添加一个即可。
此外,您还可以通过观察浏览器地址栏中的变化来解决 JavaScript 问题。
关于java - 尝试解析被javascript隐藏的html,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13666453/