http - HTTP 协议(protocol)中这些奇怪的行是什么?

标签 http

我正在通过建立合法连接从网站读取源代码,就像在 Java 中这样:

        final Socket sock = new Socket(hostname, 80);
        PrintWriter writer = new PrintWriter(sock.getOutputStream(), true);
            writer.println("GET /path HTTP/1.1");
            writer.println("Host: " + hostname);
            writer.println();
//...
            while (!sock.isClosed() && (line = reader.readLine()) != null) {
                System.out.println(line);
            }

它运行良好,除了输出中有一些奇怪的行,当我使用 Firefox 浏览网站时这些行不存在。

问题是某些源代码行会因一些随机的不同信息而中断,我不知道为什么我会得到这样的信息来破坏我的源代码。

<div clas
16d0
s="span5">

<td style="text-align:c
2000
enter; vertical-align:middle">information</td>

这是什么,我该如何解决?

最佳答案

看起来服务器正在向您发送分块数据。你能发送 HTTP/1.0 而不是 1.1 吗?这应该确保不会对响应执行分块。

关于http - HTTP 协议(protocol)中这些奇怪的行是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16561665/

相关文章:

支持的 Http 最大 GET/POST 查询参数

python-3.x - Wordpress REST API、Oauth1 和 python 请求不起作用

security - 加强 HTTP 流量使其不可重现的想法

ios - 409 是 Alamofire 的成功吗?

javascript - 使用 iojs 创建 http 请求时如何捕获 EHOSTDOWN 套接字错误?

用于分析和捕获请求/响应的 HTTP 工具

javascript - http|https NodeJS 模块将目标 url 更改为 http 导致重定向

java - 无法在 Java 中发送帖子表单

php - 内部重定向对客户端 php 可见

php - 内容编码错误