c++ - std::cout 和 printf 正在从 C++ 中删除字符

标签 c++ c json networking encoding

我正在使用 socket.h 从 url 下载文件,当我尝试输出缓冲区的内容时,我只得到其中的一部分。 这是 to 文件,一个基本的 json 文件。 http://82.80.47.90/WarningMessages/alerts.json

相关代码 -

 size_t MAX_DATA_LENGTH = 50001;
 char bufIn[MAX_DATA_LENGTH];
 dataLength = recv(sockfd, bufIn, MAX_DATA_LENGTH-1, 0);
 bufIn[dataLength] = '\0';
 std::cout  << "client: received data length " <<  dataLength << std::endl << bufIn;

运行时我的控制台输出 -

HTTP for oref.org.il:

Sent. client: received data length 524
HTTP/1.1 200 OK
Cache-Control: max-age=4 Content-Length: 174 Content-Type:application/json
Last-Modified: Tue, 15 Jul 2014 08:43:22 GMT
Accept-Ranges: bytes
ETag: W/"6bad3d68a0cf1:2d5"
Server: Microsoft-IIS/6.0
X-Powered-By: ASP.NET
Date: Tue, 15 Jul 2014 08:44:45 GMT
Set-Cookie: cookiesession1=KI4GAQVLKVW4JFN90R6B9GAANOO8HAYR;Path=/

��{

当...当我嗅探数据包时,输出是 -

{ "id" : "1405424602778", "title" : " ", "data" : [] }

或者:

0000   ff fe 7b 00 20 00 0d 00 0a 00 22 00 69 00 64 00  ..{. .....".i.d.
0010   22 00 20 00 3a 00 20 00 22 00 31 00 34 00 30 00  ". .:. .".1.4.0.
0020   35 00 34 00 32 00 34 00 36 00 30 00 32 00 37 00  5.4.2.4.6.0.2.7.
0030   37 00 38 00 22 00 2c 00 0d 00 0a 00 22 00 74 00  7.8.".,.....".t.
0040   69 00 74 00 6c 00 65 00 22 00 20 00 3a 00 20 00  i.t.l.e.". .:. .
0050   22 00 e4 05 d9 05 e7 05 d5 05 d3 05 20 00 d4 05  "........... ...
0060   e2 05 d5 05 e8 05 e3 05 20 00 d4 05 ea 05 e8 05  ........ .......
0070   e2 05 d4 05 20 00 d1 05 de 05 e8 05 d7 05 d1 05  .... ...........
0080   20 00 22 00 2c 00 0d 00 0a 00 22 00 64 00 61 00   .".,.....".d.a.
0090   74 00 61 00 22 00 20 00 3a 00 20 00 5b 00 5d 00  t.a.". .:. .[.].
00a0   0d 00 0a 00 7d 00 0d 00 0a 00 0d 00 0a 00        ....}.........

我真的很感谢你的帮助。我尝试过更改编码,但编码是 UTF-8,因此没有必要更改它。
谢谢!

最佳答案

您正在向 bufIn 发送 cout 一个 const char*,因此 cout 可以判断的唯一方法它的长度是找到第一个 NUL 字节:您的数据不是 ASCII,因此它到达“ff fe 7b 00”字节并停止其输出。如果您想避免这种情况,可以使用 cout.write(bufIn, dataLength) 强制将 NUL 发送到终端,或者迭代打印 isprint() 的数据>-able 字符通常和打印表示 \八进制值 或您喜欢的任何其他符号。

此外,TCP 是一种字节流协议(protocol),这意味着您尝试读取的任何数据都可以以较小的部分交付给您,并且在字节级别上只有必要的粒度。如果您接收一次并且只获得部分数据,则应该再次循环和接收,直到获得您期望/需要的所有数据(或 EOF/断开连接/错误)。您的工作是重新组合这些数据或以适合您的需求的方式处理它。某些 API 函数确实允许您阻塞,直到检索到特定数量的字节(或 EOF/断开连接/错误),但这不是正常行为。阅读 recv 的手册页并查看一些示例,但总结如下:

size_t MAX_DATA_LENGTH = 50001;
char bufIn[MAX_DATA_LENGTH];
size_t position = 0;
size_t dataLength;
while ((dataLength = recv(sockfd, bufIn + position, MAX_DATA_LENGTH-position-1, 0)) > 0)
    position += dataLength;
dataLength = position;
bufIn[dataLength] = '\0';

这不是最干净的代码,但这是总体思路。

关于c++ - std::cout 和 printf 正在从 C++ 中删除字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24753905/

相关文章:

c++ - 字段的类型不完整 C++

c++ - C++ 字符的字母数字顺序

c++ - 比较 C 中 char[] 的相等性

c - 光线追踪器光漫射问题

json - Spark 数据帧 : reading json having duplicate column names but different datatypes

javascript - 为什么 JavaScript 中的 saveAs() 对我不起作用?

c++ - 使用 boost - 将它放在源代码管理中还是让任何开发人员自己安装?

c - 用于修改正在运行的 C 程序的行为的脚本

在 C 中使用数组更改和更新值

ios - 从 nsstring 发送 Post http 请求