c++ - 如何使用 sigsegv 捕获内存读取和写入？

如何欺骗 linux 使其认为内存读/写成功？我正在编写一个 C++ 库，以便所有读/写都被重定向并透明地处理给最终用户。每当写入或读取变量时，库都需要捕获该请求并将其发送到硬件模拟，该硬件模拟将从那里处理数据。

请注意，我的库依赖于平台:

Linux ubuntu 3.16.0-39-generic #53~14.04.1-Ubuntu SMP x86_64 GNU/Linux

gcc (Ubuntu 4.8.2-19ubuntu1) 4.8.2

当前方法:捕获 SIGSEGV 并增加 REG_RIP

我目前的方法是使用 mmap() 获取内存区域并使用 mprotect() 关闭访问。我有一个 SIGSEGV 处理程序来获取包含内存地址的信息，将读/写导出到其他地方，然后增加上下文 REG_RIP。

void handle_sigsegv(int code, siginfo_t *info, void *ctx)
{
    void *addr = info->si_addr;
    ucontext_t *u = (ucontext_t *)ctx;
    int err = u->uc_mcontext.gregs[REG_ERR];
    bool is_write = (err & 0x2);
    // send data read/write to simulation...
    // then continue execution of program by incrementing RIP
    u->uc_mcontext.gregs[REG_RIP] += 6;
}

这适用于非常简单的情况，例如:

int *num_ptr = (int *)nullptr;
*num_ptr = 10;                          // write segfault

但是对于稍微复杂一点的事情，我会收到一个 SIGABRT:

30729 Illegal instruction (core dumped) ./$target

在 SIGSEGV 处理程序中使用 mprotect()

如果我不增加 REG_RIP，handle_sigsegv() 将被内核一遍又一遍地调用，直到内存区域可供读取或写入。我可以为该特定地址运行 mprotect() ，但这有多个警告:

由于内存区域现在具有 PROT_WRITE 功能，后续内存访问不会触发 SIGSEGV。我试图创建一个线程，不断将该区域标记为 PROT_NONE，但这并没有忽略下一点:
mprotect() 将在一天结束时执行对内存的读取或写入，使我的库的用例无效。

编写设备驱动程序

我还尝试编写一个设备模块，以便库可以在 char 设备上调用 mmap()，驱动程序将从那里处理读取和写入。这在理论上是有道理的，但我无法(或不知道)捕获每个加载/存储处理器问题到设备。我已尝试覆盖映射的 vm_operations_struct 和/或 inode 的 address_space_operations 结构，但这只会在页面出现故障或页面被刷新到后备存储时调用读/写.

也许我可以在无处写入数据的设备上使用 mmap() 和 mprotect()，就像上面解释的那样(类似于 /dev/null )，然后有一个进程来识别读/写并从那里路由数据(？)。

利用syscall()并提供restorer组装函数

以下内容来自 segvcatch 项目¹，该项目将 segfaults 转换为异常。

#define RESTORE(name, syscall) RESTORE2(name, syscall)
#define RESTORE2(name, syscall)\
asm(\
    ".text\n"\
    ".byte 0\n"\
    ".align 16\n"\
    "__" #name ":\n"\
    "   movq $" #syscall ", %rax\n"\
    "   syscall\n"\
);
RESTORE(restore_rt, __NR_rt_sigreturn)
void restore_rt(void) asm("__restore_rt") __attribute__
((visibility("hidden")));

extern "C" {
    struct kernel_sigaction {
        void (*k_sa_sigaction)(int, siginfo_t *, void *); 
        unsigned long k_sa_flags;
        void (*k_sa_restorer)(void);
        sigset_t k_sa_mask;
    };  
}

// then within main ...
struct kernel_sigaction act;
act.k_sa_sigaction = handle_sigegv;
sigemptyset(&act.k_sa_mask);
act.k_sa_flags = SA_SIGINFO|0x4000000;
act.k_sa_restorer = restore_rt;
syscall(SYS_rt_sigaction, SIGSEGV, &act, NULL, _NSIG / 8);

但这最终的功能与常规的 sigaction() 配置没有什么不同。如果我不设置恢复函数，则不会多次调用信号处理程序，即使内存区域仍然不可用。也许我可以在这里对内核信号做一些其他的诡计。

同样，库的整个目标是透明地处理对内存的读取和写入。也许有更好的处理方式，可能使用 ptrace() 甚至更新生成 segfault 信号的内核代码，但重要的部分是最终用户的代码不需要更改.我已经看到使用 setjmp() 和 longjmp() 在段错误后继续的示例，但这需要将这些调用添加到每个内存访问。将段错误转换为 try/catch 也是如此。

¹ segvcatch project

最佳答案

您可以使用 mprotect 并通过让 SIGSEGV 处理程序在标志寄存器中设置 T 标志来避免您注意到的第一个问题。然后，添加一个恢复 mprotected 内存并清除 T 标志的 SIGTRAP 处理程序。

T 标志使处理器单步执行，因此当 SEGV 处理程序返回时，它将执行该单条指令，然后立即执行 TRAP。

这仍然会给您留下第二个问题——读/写指令实际上会发生。您可以通过在两个信号处理程序中的指令之前和/或之后仔细修改内存来解决该问题...

关于c++ - 如何使用 sigsegv 捕获内存读取和写入？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30922318/

c++ - 如何使用 sigsegv 捕获内存读取和写入？

上一篇：PHP 生成器 - 垃圾收集

下一篇：r - 如何将多个大型 data.table 对象附加到单个 data.table 并快速导出到 csv 而不会耗尽内存？