java - 如何使用Java下载 protected 网页

标签 java security download automation html

我们有一个任务，设计一个可以下载任意网页源码的类。但是当我尝试测试我的代码并获取像 http://anidb.net/perl-bin/animedb.pl?show=main 这样的页面时 – 没有任何效果。

像这样的标准代码失败了:

import java.net.*;
import java.io.*;

public class URLReader {
    public static void main(String[] args) throws Exception {
        URL link = new URL("http://www.anidb.net/");
        BufferedReader in = new BufferedReader(
        new InputStreamReader(link.openStream()));

        String inputLine;
        while ((inputLine = in.readLine()) != null)
            System.out.println(inputLine);
        in.close();
    }
}

这是我得到的结果:

&#352;wq>&#178;"¦§5&#180;_&#239;__&#199;U&#186;=&#244;&#217;&#246;?k&#352;}~“bd`?l“&#207;&#231;z&#162;&#199;&#234;&#245;>_"?j&#215;‰R“y}K&#184;\&#204;c_DL&#217;&#170;&#207;_
    –&#243;Mm_&#188;_0”•&#246;°&#203;C_a&#237;&#189;s&#238;¤&#236;&#193;S ‚>dC0&#236;s_–y&#185;&#241;±&#207;&#221;&#220;A&#248;%&#200;_&#228;&#214;&#225;__&#230;©A@,4x„&#352;¶_&#235;&#201;&#402;?

我已经尝试了一切:cookies、头文件，但似乎没有任何效果。如果您对我有一些提示，我将不胜感激。

最佳答案

写一个http客户端，你必须考虑gzip编码和分块传输。最好使用库来下载网页。

尝试这样的事情: http://code.google.com/p/google-http-java-client/

关于java - 如何使用Java下载 protected 网页，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12542266/

上一篇：php - 如何在 PHP/HTML 中将特定的类名传递给特定的标签

下一篇：jquery - 如何使用jQuery遍历一组元素并设置奇偶类？

相关文章：

java - Android 开始日历 Intent 与开始和结束时间

java - 使用 Hibernate 和 Guice 管理 JavaSE 中的事务

php - 我的 PHP 登录系统有多安全？

c - 如何使用winsock或wininet下载文件

c# - 更新 C# 应用程序替换 .exe 文件

java - Glassfish resources/jndi/jdbc登录凭证配置

java - AWS Lambda 使用 Spring Data JPA 连接 RDS

internet-explorer - 为什么实现 IObjectSafety 没有什么不同？

Java jersey 导入包

ruby-on-rails - Ruby on Rails 文件下载链接