我正在使用 Jsoup 通过 URL 获取 html 文档。当我通过 Chrome 打开此 Url 并显示页面源代码时,我发现此处的文档与我在应用程序中获取的文档不同。 所以我无法提取所需的元素。你见过这样的问题吗?
最佳答案
这可能是因为您的 JSOUP 请求具有与您的浏览器不同的用户代理
。通过执行以下操作来更改它:
doc = Jsoup.connect("myURL")
.userAgent("Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36")
.get();
您可以通过启动浏览器的开发人员工具 (f12) 并检查该值来找到正确的 USER AGENT
字符串。
关于java - 我在 JSoup 中收到不同的 HTML 文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31105741/