c++ - 重复映射和取消映射单个页面时,mmap() 无法分配内存

标签 c++ linux mmap

我已经阅读了许多 SO(和其他)问题,但找不到对我有帮助的问题。我想一次 mmap 两个文件并逐字节复制它们的内容(我知道这看起来很荒谬,但这是我最小的可重现示例)。因此,我遍历每个字节,复制它,在文件中的一页大小之后,我 munmap 当前页面和 mmap 下一页。 Imo 每个文件应该只需要一页(4096 字节),所以不应该有任何内存问题。

此外,如果输出文件太小,则通过 posix_fallocate 分配内存,运行良好。在我看来,硬盘驱动器内存空间不足也不是问题。

但是,当我准备使用大约 140 MB 的大文件时,我从正在写入的输出文件中收到了 cannot allocate memory 错误。你们知道这是怎么回事吗?

#include <sys/types.h>
#include <sys/mman.h>
#include <err.h>
#include <fcntl.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <iostream>
#include <bitset>
#include <fcntl.h>
#include <sys/stat.h>
#include <math.h>
#include <errno.h>

using namespace std;

int main()
{

    char file_input[] = "medium_big_file";
    char file_output[] = "foo_output";
    int fd_input = -1;
    int fd_output = -1;
    unsigned char *map_page_input, *map_page_output;
    struct stat stat_input, stat_output;

    if ((fd_input = open(file_input, O_RDONLY)) == -1 ||
          (fd_output = open(file_output, O_RDWR|O_CREAT, 0644)) == -1) {
            cerr << "Error on open()" << endl;
            return EXIT_FAILURE;
    }

    // get file size via stat()
    stat(file_input, &stat_input);
    stat(file_output, &stat_output);
    const size_t size_input = stat_input.st_size;
    const size_t size_output = stat_output.st_size;

    const size_t pagesize = getpagesize();

    size_t page = 0;
    size_t pos = pagesize;

    if (size_output < size_input) {
      if (posix_fallocate(fd_output, 0, size_input) != 0) {
        cerr << "file space allocation didn't work" << endl;
        return EXIT_FAILURE;
      }
    }

    while(pos + (pagesize * (page-1)) < size_input) {
      // check if input needs the next page
      if (pos == pagesize) {
        munmap(&map_page_input, pagesize);
        map_page_input = (unsigned char*)mmap(NULL, pagesize, PROT_READ,
          MAP_FILE|MAP_PRIVATE, fd_input, page * pagesize);
        munmap(&map_page_output, pagesize);
        map_page_output = (unsigned char*)mmap(NULL, pagesize,
          PROT_READ|PROT_WRITE, MAP_SHARED, fd_output, page * pagesize);
        page += 1;
        pos = 0;
        if (map_page_output == MAP_FAILED) {
      cerr << "errno: " << strerror(errno) << endl;
          cerr << "mmap failed on page " << page << endl;
          return EXIT_FAILURE;
        }
      }

      memcpy(&map_page_output[pos], &map_page_input[pos], 1);

      pos += 1;
    }

    munmap(&map_page_input, pagesize);
    munmap(&map_page_output, pagesize);


    close(fd_input);
    close(fd_output);
    return EXIT_SUCCESS;
}

最佳答案

循环的第一次迭代尝试取消映射从未映射的内容,并将完全未初始化的指针传递给 munmap。不是一次,而是两次。

最后,munmap 需要一个指向 mmap 内存的指针,而不是指向 mmap 内存的指针。

显示的代码无法检查 munmap 的返回状态。如果是这样,它会发现每次调用 munmap 都会失败(希望如此,但如果第一次调用恰好传递了一个对齐的指针,那么堆栈的一部分可能最终会被取消映射,随之而来的欢闹),所以显示的代码只是不断分配越来越多的页面,并耗尽内存。

您必须修复这两个错误。

关于c++ - 重复映射和取消映射单个页面时,mmap() 无法分配内存,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65668445/

相关文章:

c++ - 类似于 mmap(NULL, sz, PROT_READ | PROT_WRITE, MAP_PRIVATE | MAP_ANONYMOUS, -1, 0);在窗口中

c++ - C++ 中的循环引用内存泄漏

c++ - 关于 C++ 模板最重要的事情……经验教训

c++ - 如何打印出 vector 的内容?

c++ - openGL 3 问题 : undefined reference to _glapi_tls_Dispatch

linux - 如何使用 sed 在现有文件的开头添加 UTF-16 字符?

linux - Cygwin 不支持 glibc

offset - 为什么 mmap() 中的文件起始偏移量必须是页面大小的倍数

c# - Typedefs、C++/CLI、C# + 依赖注入(inject)

linux - mmap 是原子的吗?