c - C中具有大量字符的字节顺序

标签 c sockets endianness

我正在用 C 语言进行一些套接字编程,并试图解决字节顺序问题。我的请求(发送)没问题,但是当我收到数据时,我的字节全乱了。我从这样的事情开始:

char * aResponse= (char *)malloc(512);
int total = recv(sock, aResponse, 511, 0);

处理此响应时,每个 16 位字似乎都颠倒了字节(我使用的是 UDP)。我试图通过做这样的事情来解决这个问题:

    unsigned short * _netOrder= (unsigned short *)aResponse;
    unsigned short * newhostOrder= (unsigned short *)malloc(total);
    for (i = 0; i < total; ++i)
    {
         newhostOrder[i] = ntohs(_netOrder[i]);
    }

当我将数据视为一个 short 时,这工作正常,但是如果我再次将指针转换为 char,字节将被反转。我做错了什么?

最佳答案

好的,您在两个不同层面上所做的事情似乎存在问题。这里的部分混淆似乎源于您对指针的使用,它们指向什么类型的对象,然后是对指针指向的内存中值的编码的解释。

内存中多字节实体的编码称为字节顺序。这两种常见的编码称为 Little Endian (LE) 和 Big Endian (BE)。使用 LE,像 short 这样的 16 位数量首先被编码为最低有效字节 (LSB)。在 BE 下,最高有效字节 (MSB) 首先编码。

按照惯例,网络协议(protocol)通常将事物编码为我们所说的“网络字节顺序”(NBO),这也恰好与 BE 相同。如果您在大端平台上发送和接收内存缓冲区,那么您将不会遇到转换问题。但是,您的代码将成为依赖于 BE 约定的平台。如果您想编写可在 LE 和 BE 平台上正常工作的可移植代码,则不应假定平台的字节顺序。

实现端序可移植性是 ntohs()ntohl() 等例程的目的>htons()htonl()。这些函数/宏是在给定平台上定义的,用于在发送端和接收端进行必要的转换:

  • htons() - 将短值从主机订单转换为网络订单(用于发送)
  • htonl() - 将 long 值从主机顺序转换为网络顺序(用于发送)
  • ntohs() - 将短值从网络订单转换为主机订单(接收后)
  • ntohl() - 将 long 值从网络订单转换为主机订单(接收后)

了解您关于在转换回字符时访问内存的评论对内存中实体的实际顺序没有影响。也就是说,如果您以一系列字节的形式访问缓冲区,无论您使用的是 BE 还是 LE 机器,您都将按照它们实际编码到内存中的任何顺序看到这些字节。因此,如果您在接收后查看 NBO 编码缓冲区,则 MSB 将排在第一位 - 始终如此。如果您在转换回主机顺序后查看输出缓冲区,如果您有 BE 机器,则字节顺序将保持不变。相反,在 LE 机器上,字节现在将在转换后的缓冲区中全部反转。

最后,在您的转换循环中,变量 total 指的是字节。但是,您正在以 shorts 的形式访问缓冲区。你的循环守卫不应该是total,而应该是:

总计/sizeof( unsigned short )

考虑到每个 short 的双字节性质。

关于c - C中具有大量字符的字节顺序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/526030/

相关文章:

sockets - 在 Golang 中限制 tcp 下载速度

c - htons() 在 Big-Endian 系统上做什么?

c - 如何在 C 中获取初始化的非顺序数组索引

像 Cat 一样在 Windows 中获取二进制数据作为字符串的命令行工具?

javascript - 多个 http.get 请求的套接字挂起错误

c - 将 unsigned char 移动超过 8 位

c++ - 使用 qFromBigEndian 从 Char 转换为 Int 表示 : "No matching function for call to"

c# - 在 C# 中使用 C 结构体

c - 有没有可能用给定的 B 和 C 在 "A & B = C"中恢复 A?

java - 将字节写入 java 套接字