我们有一个任务,设计一个可以下载任意网页源码的类。但是当我尝试测试我的代码并获取像 http://anidb.net/perl-bin/animedb.pl?show=main
这样的页面时 – 没有任何效果。
像这样的标准代码失败了:
import java.net.*;
import java.io.*;
public class URLReader {
public static void main(String[] args) throws Exception {
URL link = new URL("http://www.anidb.net/");
BufferedReader in = new BufferedReader(
new InputStreamReader(link.openStream()));
String inputLine;
while ((inputLine = in.readLine()) != null)
System.out.println(inputLine);
in.close();
}
}
这是我得到的结果:
Šwq>²"¦§5´_ï__ÇUº=ôÙö?kŠ}~“bd`?l“Ïçz¢Çêõ>_"?j׉R“y}K¸\Ìc_DLÙªÏ_
–óMm_¼_0”•ö°ËC_aí½sî¤ìÁS ‚>dC0ìs_–y¹ñ±ÏÝÜAø%È_äÖá__æ©A@,4x„Š¶_ëɃ?
我已经尝试了一切:cookies、头文件,但似乎没有任何效果。如果您对我有一些提示,我将不胜感激。
最佳答案
写一个http客户端,你必须考虑gzip编码和分块传输。最好使用库来下载网页。
关于java - 如何使用Java下载 protected 网页,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12542266/