c - brk() 系统调用有什么作用？

根据Linux程序员手册:

brk() and sbrk() change the location of the program break, which defines the end of the process's data segment.

这里的数据段是什么意思？只是数据段还是数据、BSS、堆结合？

根据维基 Data segment :

Sometimes the data, BSS, and heap areas are collectively referred to as the "data segment".

我认为没有理由只更改数据段的大小。如果是数据，BSS和堆一起，那么这是有道理的，因为堆将获得更多空间。

这让我想到了第二个问题。在我到目前为止阅读的所有文章中，作者都说堆向上增长，堆栈向下增长。但是他们没有解释的是，当堆占据了堆和栈之间的所有空间时会发生什么？

enter image description here

最佳答案

在您发布的图表中，“break”(由 brk 和 sbrk 操作的地址)是堆顶部的虚线。

simplified image of virtual memory layout

您阅读的文档将其描述为“数据段”的结尾，因为在传统的(预共享库，预 mmap)Unix 中，数据段与堆是连续的;在程序启动之前，内核会将“文本”和“数据” block 加载到从地址零开始的 RAM 中(实际上稍微高于地址零，因此 NULL 指针确实没有指向任何东西)并将中断地址设置为数据段的结尾。对 malloc 的第一次调用将使用 sbrk 移动分解并在数据段的顶部和新的之间创建堆 , 更高的中断地址，如图所示，随后使用 malloc 将根据需要使用它来使堆变大。

同时，堆栈从内存顶部开始并向下增长。堆栈不需要显式系统调用来使其更大；要么从分配给它的尽可能多的 RAM 开始(这是传统方法)，要么在堆栈下方有一个保留地址区域，当内核注意到有写入尝试时会自动将 RAM 分配到该区域(这是现代方法)。无论哪种方式，地址空间底部可能有也可能没有可用于堆栈的“保护”区域。如果该区域存在(所有现代系统都这样做)，则永久未映射；如果任一堆栈或堆试图增长到它，你会得到一个段错误。不过，传统上，内核不会尝试强制执行边界。堆栈可以增长到堆中，或者堆可以增长到堆栈中，无论哪种方式，他们都会在彼此的数据上乱涂乱画，程序就会崩溃。如果你很幸运，它会立即崩溃。

我不确定此图中的数字 512GB 来自何处。它意味着一个 64 位的虚拟地址空间，这与您在那里的非常简单的内存映射不一致。一个真正的 64 位地址空间看起来更像这样:

Legend: t: text, d: data, b: BSS

这不是远程扩展的，它不应该被解释为任何给定操作系统的确切工作方式(在我画了它之后，我发现 Linux 实际上使可执行文件比我想象的更接近零地址，并且位于惊人高地址的共享库)。该图的黑色区域未映射 - 任何访问都会立即导致段错误 - 相对于灰色区域，它们是巨大的。浅灰色区域是程序及其共享库(可能有几十个共享库)；每个都有一个独立文本和数据段(和“bss”段，它也包含全局数据，但初始化为全位为零，而不是占用磁盘上的可执行文件或库中的空间)。堆不再必须与可执行文件的数据段连续——我是这样画的，但至少看起来 Linux 并没有这样做。栈不再与虚拟地址空间的顶部 Hook ，堆与栈之间的距离如此之大，不用担心越过它。

break 仍然是堆的上限。然而，我没有展示的是，在某个地方可能有几十个独立的内存分配，使用 mmap 而不是 brk。 (操作系统会尽量让它们远离 brk 区域，以免它们发生碰撞。)

关于c - brk() 系统调用有什么作用？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6988487/

c - brk() 系统调用有什么作用？

上一篇：python - 如何在 Vim 中注释掉一段 Python 代码

下一篇：python - 如何在不使用库的情况下在 python 中按自定义月份增加日期时间