java - 如何使用 HtmlUnit 获得 URL 的最终重定向

标签 java htmlunit

我有网址 https://www.facebook.com/ads/library/?id=286238429359299被重定向到 https://www.facebook.com/ads/library/?active_status=all&ad_type=political_and_issue_ads&country=US&impression_search_field=has_impressions_lifetime&id=286238429359299&view_all_page_id=575939395898200在浏览器中。
我正在使用以下代码:

    @Test
    public void createWebClient() throws IOException {
        getLogger("com.gargoylesoftware").setLevel(OFF);
        WebClient webClient = new WebClient(CHROME);
        WebClientOptions options = webClient.getOptions();
        options.setJavaScriptEnabled(true);
        options.setRedirectEnabled(true);
        webClient.waitForBackgroundJavaScriptStartingBefore(10000);
        // IMPORTANT: Without the country/language selection cookie the redirection does not work!
        URL s = webClient.getPage("https://www.facebook.com/ads/library/?id=286238429359299").getUrl();
    }

上面的代码没有考虑重定向，有什么我遗漏的吗？我需要获取原始 URL 解析到的最终 URL。

最佳答案

实际上是网址 https://www.facebook.com/ads/library/?id=286238429359299返回一个带有javascript的页面。javascript会检测web浏览器的环境。例如js会检测当前浏览器是否为Headless浏览器，web驱动是否合法。所以我认为解决方案是分析javascript和您将获得最终网址。

关于java - 如何使用 HtmlUnit 获得 URL 的最终重定向，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63000800/

上一篇：visual-studio-code - 如何在 Visual Studio Code Explorer 中排除某些文件扩展名

下一篇：sql - DBCC CLEANTABLE 未释放已用空间

java - 将 XMLGregorianCalendar 转换为 LocalDateTime 时出现时区不一致

java - null、0 和 nothing 之间有什么区别？

java - htmlunit knockout js 不起作用。单击提交按钮返回同一页面

java - 使用java和htmlunit获取vbulletin中用户的用户组

java - 将值放入 LinkedHashMap 多维

java - 用于在 JAX-RS 服务中设置 HTTP 响应 header 的自定义注释

java - 按类别获取页面上的所有 tr

java - 如何用htmlunit解决Java堆空间问题

java - 使用 HtmlUnit 登录