java - 我在 JSoup 中收到不同的 HTML 文档

标签 java android jsoup

我正在使用 Jsoup 通过 URL 获取 html 文档。当我通过 Chrome 打开此 Url 并显示页面源代码时,我发现此处的文档与我在应用程序中获取的文档不同。 所以我无法提取所需的元素。你见过这样的问题吗?

最佳答案

这可能是因为您的 JSOUP 请求具有与您的浏览器不同的用户代理。通过执行以下操作来更改它:

doc = Jsoup.connect("myURL")
        .userAgent("Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36")
        .get();

您可以通过启动浏览器的开发人员工具 (f12) 并检查该值来找到正确的 USER AGENT 字符串。

关于java - 我在 JSoup 中收到不同的 HTML 文档,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31105741/

相关文章:

java - 使用 JSoup 抓取网页

java - 我应该为我的库存系统使用静态列表吗?

android - AdMob是为展示还是仅为点击付费?

android - OkHttpClient 2.0 上的缓存问题

Android 与桌面应用程序

android - import org.w3c.dom.Document 与 android 中的另一个 import 语句冲突

java - 如何将多个 <input type =“checkbox”/> 作为数组发送到 Java servlet?

java - 在二维数组中识别 .length

java - 为什么编译器将泛型类型转换为原始类型?

java - 强制改造以加载新数据