java - 尝试解析被javascript隐藏的html

标签 java javascript html jsoup

我创建了一个简单的 Java 脚本,它使用 Jsoup 来解析数据页。然而,网站创建者已经更改了页面,以至于如果页面上有一定量的数据,它会给您提供优化搜索的意见,或者,您可以单击链接,数据就会出现。我一直在绞尽脑汁地寻找解决方案,网址没有改变,链接的 href 只是 javacript:void(0);。有什么方法可以仅使用我的脚本获取包含数据的 html 吗?

最佳答案

尝试使用类似 Selenium 之类的驱动网络浏览器的东西。这是我唯一用过的,从来不需要其他任何东西。我确信有不同的可能更适合您,您应该测试一些,或者不测试。一旦您使用 selenium(或您选择的任何 Web 驱动程序)获取 javascript 元素,请将它们解析为 JSoup 元素。 这样您就不必完全更改库,而只需添加一个即可。

此外,您还可以通过观察浏览器地址栏中的变化来解决 JavaScript 问题。

关于java - 尝试解析被javascript隐藏的html,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13666453/

相关文章:

java - Java 的 UI 控件

javascript - 调试 Firefox 插件时的错误 - 未选中 lastError 值 : Error

javascript - 选择页面上的 2 个按钮

html - 一页网站基本布局

javascript - Post 请求缺少边界 header

html - 使用 html css 创建垂直标签

java - 如何配置 Spring BeanPostProcessor 使其仅针对一组已定义的 Spring 托管 bean 进行调用

java - 如何使用 bat 文件在 Windows 服务器上卸载 java?

java - Tomcat 上的 Tapestry Web App 偶尔会吐出垃圾

javascript - 如果有多个实例,则执行一次方法