c++ - 如何使用 sigsegv 捕获内存读取和写入?

标签 c++ linux ubuntu memory kernel

如何欺骗 linux 使其认为内存读/写成功?我正在编写一个 C++ 库,以便所有读/写都被重定向并透明地处理给最终用户。每当写入或读取变量时,库都需要捕获该请求并将其发送到硬件模拟,该硬件模拟将从那里处理数据。

请注意,我的库依赖于平台:

Linux ubuntu 3.16.0-39-generic #53~14.04.1-Ubuntu SMP x86_64 GNU/Linux

gcc (Ubuntu 4.8.2-19ubuntu1) 4.8.2

当前方法:捕获 SIGSEGV 并增加 REG_RIP

我目前的方法是使用 mmap() 获取内存区域并使用 mprotect() 关闭访问。我有一个 SIGSEGV 处理程序来获取包含内存地址的信息,将读/写导出到其他地方,然后增加上下文 REG_RIP。

void handle_sigsegv(int code, siginfo_t *info, void *ctx)
{
    void *addr = info->si_addr;
    ucontext_t *u = (ucontext_t *)ctx;
    int err = u->uc_mcontext.gregs[REG_ERR];
    bool is_write = (err & 0x2);
    // send data read/write to simulation...
    // then continue execution of program by incrementing RIP
    u->uc_mcontext.gregs[REG_RIP] += 6;
}

这适用于非常简单的情况,例如:

int *num_ptr = (int *)nullptr;
*num_ptr = 10;                          // write segfault

但是对于稍微复杂一点的事情,我会收到一个 SIGABRT:

30729 Illegal instruction (core dumped) ./$target

在 SIGSEGV 处理程序中使用 mprotect()

如果我不增加 REG_RIP,handle_sigsegv() 将被内核一遍又一遍地调用,直到内存区域可供读取或写入。我可以为该特定地址运行 mprotect() ,但这有多个警告:

  • 由于内存区域现在​​具有 PROT_WRITE 功能,后续内存访问不会触发 SIGSEGV。我试图创建一个线程,不断将该区域标记为 PROT_NONE,但这并没有忽略下一点:
  • mprotect() 将在一天结束时执行对内存的读取或写入,使我的库的用例无效。

编写设备驱动程序

我还尝试编写一个设备模块,以便库可以在 char 设备上调用 mmap(),驱动程序将从那里处理读取和写入。这在理论上是有道理的,但我无法(或不知道)捕获每个加载/存储处理器问题到设备。我已尝试覆盖映射的 vm_operations_struct 和/或 inode 的 address_space_operations 结构,但这只会在页面出现故障或页面被刷新到后备存储时调用读/写.

也许我可以在无处写入数据的设备上使用 mmap()mprotect(),就像上面解释的那样(类似于 /dev/null ),然后有一个进程来识别读/写并从那里路由数据(?)。

利用syscall()并提供restorer组装函数

以下内容来自 segvcatch 项目1,该项目将 segfaults 转换为异常。

#define RESTORE(name, syscall) RESTORE2(name, syscall)
#define RESTORE2(name, syscall)\
asm(\
    ".text\n"\
    ".byte 0\n"\
    ".align 16\n"\
    "__" #name ":\n"\
    "   movq $" #syscall ", %rax\n"\
    "   syscall\n"\
);
RESTORE(restore_rt, __NR_rt_sigreturn)
void restore_rt(void) asm("__restore_rt") __attribute__
((visibility("hidden")));

extern "C" {
    struct kernel_sigaction {
        void (*k_sa_sigaction)(int, siginfo_t *, void *); 
        unsigned long k_sa_flags;
        void (*k_sa_restorer)(void);
        sigset_t k_sa_mask;
    };  
}

// then within main ...
struct kernel_sigaction act;
act.k_sa_sigaction = handle_sigegv;
sigemptyset(&act.k_sa_mask);
act.k_sa_flags = SA_SIGINFO|0x4000000;
act.k_sa_restorer = restore_rt;
syscall(SYS_rt_sigaction, SIGSEGV, &act, NULL, _NSIG / 8); 

但这最终的功能与常规的 sigaction() 配置没有什么不同。如果我不设置恢复函数,则不会多次调用信号处理程序,即使内存区域仍然不可用。也许我可以在这里对内核信号做一些其他的诡计。


同样,库的整个目标是透明地处理对内存的读取和写入。也许有更好的处理方式,可能使用 ptrace() 甚至更新生成 segfault 信号的内核代码,但重要的部分是最终用户的代码不需要更改.我已经看到使用 setjmp()longjmp() 在段错误后继续的示例,但这需要将这些调用添加到每个内存访问。将段错误转换为 try/catch 也是如此。


1 segvcatch project

最佳答案

您可以使用 mprotect 并通过让 SIGSEGV 处理程序在标志寄存器中设置 T 标志来避免您注意到的第一个问题。然后,添加一个恢复 mprotected 内存并清除 T 标志的 SIGTRAP 处理程序。

T 标志使处理器单步执行,因此当 SEGV 处理程序返回时,它将执行该单条指令,然后立即执行 TRAP。

这仍然会给您留下第二个问题——读/写指令实际上会发生。您可以通过在两个信号处理程序中的指令之前和/或之后仔细修改内存来解决该问题...

关于c++ - 如何使用 sigsegv 捕获内存读取和写入?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30922318/

相关文章:

c++ - 创建 C++ 图形用户界面 : What is the easiest way to do it?

c++ - 如何在复制构造函数中调用重载的下标?

C程序从连接到系统的USB设备读取数据

linux - Qt程序只接收来自特定IP地址的UDP

linux - 最小的动态链接 ELF 程序需要哪些部分?

c++ - QMainWindow中选择 "central widget"的规则是什么?为什么它很重要?

git - 在变量中分配命令的结果

ubuntu - 将 Boilerplate Ignite 与 React Native 集成

c - 我如何才能不卡住单击后处理信息的 GTK 按钮?

c++ - 编译器如何处理 a[i] 其中 a 是数组?如果 a 是一个指针呢?