c - brk() 系统调用有什么作用?

标签 c linux unix memory-management brk

根据Linux程序员手册:

brk() and sbrk() change the location of the program break, which defines the end of the process's data segment.

这里的数据段是什么意思?只是数据段还是数据、BSS、堆结合?

根据维基 Data segment :

Sometimes the data, BSS, and heap areas are collectively referred to as the "data segment".

我认为没有理由只更改数据段的大小。如果是数据,BSS和堆一起,那么这是有道理的,因为堆将获得更多空间。

这让我想到了第二个问题。在我到目前为止阅读的所有文章中,作者都​​说堆向上增长,堆栈向下增长。但是他们没有解释的是,当堆占据了堆和栈之间的所有空间时会发生什么?

enter image description here

最佳答案

在您发布的图表中,“break”(由 brksbrk 操作的地址)是堆顶部的虚线。

simplified image of virtual memory layout

您阅读的文档将其描述为“数据段”的结尾,因为在传统的(预共享库,预 mmap)Unix 中,数据段与堆是连续的;在程序启动之前,内核会将“文本”和“数据” block 加载到从地址零开始的 RAM 中(实际上稍微高于地址零,因此 NULL 指针确实没有指向任何东西)并将中断地址设置为数据段的结尾。对 malloc 的第一次调用将使用 sbrk 移动分解并在数据段的顶部和新的 之间创建堆 , 更高的中断地址,如图所示,随后使用 malloc 将根据需要使用它来使堆变大。

同时,堆栈从内存顶部开始并向下增长。堆栈不需要显式系统调用来使其更大;要么从分配给它的尽可能多的 RAM 开始(这是传统方法),要么在堆栈下方有一个保留地址区域,当内核注意到有写入尝试时会自动将 RAM 分配到该区域(这是现代方法)。无论哪种方式,地址空间底部可能有也可能没有可用于堆栈的“保护”区域。如果该区域存在(所有现代系统都这样做),则永久未映射;如果任一堆栈或堆试图增长到它,你会得到一个段错误。不过,传统上,内核不会尝试强制执行边界。堆栈可以增长到堆中,或者堆可以增长到堆栈中,无论哪种方式,他们都会在彼此的数据上乱涂乱画,程序就会崩溃。如果你很幸运,它会立即崩溃。

我不确定此图中的数字 512GB 来自何处。它意味着一个 64 位的虚拟地址空间,这与您在那里的非常简单的内存映射不一致。一个真正的 64 位地址空间看起来更像这样:

less simplified address space

              Legend:  t: text, d: data, b: BSS

这不是远程扩展的,它不应该被解释为任何给定操作系统的确切工作方式(在我画了它之后,我发现 Linux 实际上使可执行文件比我想象的更接近零地址,并且位于惊人高地址的共享库)。该图的黑色区域未映射 - 任何访问都会立即导致段错误 - 相对于灰色区域,它们是巨大的。浅灰色区域是程序及其共享库(可能有几十个共享库);每个都有一个独立文本和数据段(和“bss”段,它也包含全局数据,但初始化为全位为零,而不是占用磁盘上的可执行文件或库中的空间)。堆不再必须与可执行文件的数据段连续——我是这样画的,但至少看起来 Linux 并没有这样做。栈不再与虚拟地址空间的顶部 Hook ,堆与栈之间的距离如此之大,不用担心越过它。

break 仍然是堆的上限。然而,我没有展示的是,在某个地方可能有几十个独立的内存分配,使用 mmap 而不是 brk。 (操作系统会尽量让它们远离 brk 区域,以免它们发生碰撞。)

关于c - brk() 系统调用有什么作用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6988487/

相关文章:

客户端读取另一个文件后没有读取任何数据

c++ - 如何在 Linux 上的 C++ 中包含 <atomic>?

linux - 用变量替换 Bash 命令

linux - 获取从 find 命令到变量的路径

c - Visual Studio 2010 win 32位项目导入DLL

c - 按照 Beej 的网络编程指南实现聊天客户端

c - C语言中的For循环语法

linux - SED 命令替换

Windows 等效于 'nice'

c++ - 递归类头包括