java - 我无法使用 Java 代码接收网站的所有 HTML 内容

标签 java html

我使用 Java 来接收网站的 HTML 内容。但我无法接收其全部内容。有时,我收到的内容以“...”结尾,但并不是内容的结尾。你能告诉我什么是错误吗?下面是我的代码:

public static String requestHtmlContent(String sUrl){
        URL url;
        URLConnection connection;
        StringBuilder strBuilder = new StringBuilder();
        BufferedReader reader;
        try {
            url = new URL( sUrl );
            connection = url.openConnection();
            connection.setRequestProperty("User-Agent", "Mozilla/6.0 (Windows NT 6.2; WOW64; rv:16.0.1) Gecko/20121011 Firefox/16.0.1");
            InputStream is = url.openConnection().getInputStream();
            reader = new BufferedReader( new InputStreamReader( is )  );

            String line = null;
            while((line = reader.readLine())!= null);  {
                line = reader.readLine();
                strBuilder.append(line +"\n");
            }
            reader.close();

            return strBuilder.toString();

        } catch (MalformedURLException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
        return strBuilder.toString();
    }

最佳答案

在没有实际测试你的代码的情况下,我可以说这个 while 循环绝对是可疑的:

while((line = reader.readLine())!= null);  {
    line = reader.readLine();
    strBuilder.append(line +"\n");
}

while 条件消耗读取器中的一行,但该行永远不会被处理。

关于java - 我无法使用 Java 代码接收网站的所有 HTML 内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14427173/

相关文章:

javascript - 改变DIV内图片的大小

html - flex 孙子不会扩展到直接 parent 的高度

html - 为什么这些 div 会环绕并超出边距?

html - 如何使用 CSS 获得主体颜色不同的圆 Angular table ?

java - 安装应用程序时出现 "Picked up _java_options"消息,但未设置环境变量

java - 如何创建一个界面,在左侧显示对象,在右侧显示每个对象的详细信息?

java.util.ArrayList 默认容量?

java - 在Java源代码中隐藏密码

java - Lucene 和 servlet 集成

javascript - 单击表格时未选择正确的表格单元格