c - Linux 内核如何处理 TCP/IP 堆栈上的结构填充?

标签 c sockets tcp linux-kernel ip

我对内核的套接字缓冲系统有些熟悉,并且我进行了很多搜索,但我一直无法找到内核如何处理结构填充问题。内核如何打包传出 TCP/IP 数据包的字节,以便在不同平台上运行的代码可以理解它?

当从一台机器发送数据到另一台机器时,我知道你不能只按原样发送结构。然而,这正是 Linux 内核中的代码所发生的情况。我错过了什么?

最佳答案

由于您没有提到具体的代码,我只能谈论一般性的事情。

I searched a lot but I've been unable to find how the kernel handles the problem of struct padding.

GCC 提供了确保结构成员之间没有填充的机制。其中一种机制是 packed 属性。这样您就可以定义一个结构体并确切地知道该结构体的内存布局是什么。

How does the kernel pack the bytes of the outgoing TCP/IP packet so that code running on a different platform can make sense of it?

TCP/IP 定义 TCP 和 IP header 的内存布局。您可以找到有关它们的信息here .

When sending data from one machine to another, I know you can't just send your structs as is.

事实上你可以,你只需要非常谨慎地对待你如何做,Linux 基本上就是这样。由于某些原因,仅通过 TCP 套接字将结构发送到具有相同结构定义的另一个程序是危险的。采用以下结构:

struct my_struct {
    uint32 foo;
    uint64 bar;
}

人们说你不应该只发送结构的一个原因是该结构的内存布局在不同的机器或不同的编译器上可能会有所不同。例如,在 32 位计算机上可能不会有任何填充,在 64 位计算机上,foobar 之间可能有 32 位填充。我使用诸如可能可能之类的词,因为编译器不会被迫添加填充;这只是它可能做的优化。即使机器都是 64 位,如果您使用不同的编译器,您也可能会得到不同的结果,因为不同的编译器可能会添加或不添加填充。还有endianness的问题,所以如果您使用的是小端机器,您应该转换为大端,因为这就是指定的网络字节顺序。另一个需要考虑的问题(我的示例没有考虑)是某些类型将具有不同的大小,这又取决于编译器和体系结构。例如,size_t 在 32 位机器上可能是 32 位,在 64 位机器上可能是 64 位。因此,不同机器上的相同代码将产生不同大小的结构。但是,如果您使用具有特定位宽度的类型(如我的示例中所示),则这不是问题。

现在,如果您解决了 Linux 内核所做的所有问题,那么您可以只发送一个结构。

有关为什么通常通过 TCP 发送结构是一个坏主意的更多信息 this SO question可能有用。正如目前的最佳答案所述,有三个主要原因(与我在这里概述的相同),但如果你照顾好它们,这是可能的。虽然对于用户空间程序来说,在某些时候这可能不是一个好的做法,但由于 TCP 数据包等具有特定的字段要求,因此必须执行此操作。

关于c - Linux 内核如何处理 TCP/IP 堆栈上的结构填充?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31016261/

相关文章:

c - OpenGL:在圆柱体周围包裹纹理

在 C 中将二叉树转换为数组(并稍后保存)

php - 将 HEX 转换为 ASCII,来自 GPS 跟踪器的数据

c - 在 OSX 中从控制台读取输入

java - 中断套接字连接

c# - 如何通过套接字发送外部库的可序列化对象?

c++ - 在 C++ 中通过 TCP 连接发送 Opencv Mat

c++ - 在线游戏的 session 通常如何存储?

C++ - 检测死套接字

更改文件