linux - 在 fork 之前或之后对磁盘文件调用 mmap() 有什么区别？

我一直在努力理解 mmap() 如何处理磁盘支持的文件，并且基本上明白了，但我仍然有这个问题。

在主进程 fork 一堆工作子进程和文件支持的只读 mmapped db 的情况下，mmaps 发生在 fork 之前的主进程还是子进程中是否重要？

我的理解是，如果发生在fork之前的master进程，那么在内存页表中，所有的mapped 页面被设置为在读取页面时产生页面错误，触发内核从磁盘(或页面缓存)加载页面，并且在 fork 之后，一个 child 读取页面将意味着该页面在mmap 准备好供其他 child 阅读而不会导致重大页面错误。

但是如果 mmap 发生在 fork 之后的子进程中，其他 worker 子进程是否可以从共享这些加载的页面中获益——它们实际上都使用相同的底层 mmap 吗？还是每个 worker child 都必须触发页面错误并自己加载每个页面？

最佳答案

这对页面错误事件没有影响。文件的页面映射对于操作系统来说是全局的，它表示特定页面是否在 RAM 中。每个具有文件映射的进程的 PTE 都指向这个公共(public)数据结构。只有第一个尝试访问不在 RAM 中的页面的进程才会出现页面错误。这将触发它被读入，并且尝试访问同一页面的其他进程将能够使用该 RAM。

这两种情况的一个区别是分配给映射 block 的虚拟地址是否相同。如果您在 fork 之前调用 mmap，则该地址将被复制到所有子项中。如果您在 fork 后调用 mmap，它们可能会获得不同的地址。如果需要，在所有进程中使用相同的地址允许您将指针传递到进程之间的映射 block 中。 block 内的对象之间可以有指针。如果它们不在同一地址，则需要使用偏移量，并且所有进程都必须将偏移量添加到基地址。

关于linux - 在 fork 之前或之后对磁盘文件调用 mmap() 有什么区别？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55872346/

linux - 在 fork 之前或之后对磁盘文件调用 mmap() 有什么区别？

上一篇：regex - 如果子字符串出现在 CSV 中一行的任意位置，如何将列设置为一个值？

下一篇：linux - 启动 chromedriver 时如何修复 "[SEVERE]: bind() failed: Cannot assign requested address (99)"