c - 内联汇编无法在没有优化的情况下编译

标签 c linux x86 inline-assembly cpu-registers

我在 32 位 Linux 进程中需要 futex 系统调用,但不能使用 syscall功能(标题不可用)。这仍然可以通过使用内联 asm 来完成,如下所示:

#include <time.h>

#define SYS_futex 0xf0

// We need -fomit-frame-pointer in order to set EBP
__attribute__((optimize("-fomit-frame-pointer")))
int futex(int* uaddr, int futex_op, int val, const struct timespec* timeout, int* uaddr2, int val3)
{
    register int ebp asm ("ebp") = val3;
    int result;
    asm volatile("int $0x80"
                 : "=a"(result)
                 : "a"(SYS_futex), "b"(uaddr), "c"(futex_op), "d"(val), "S"(timeout), "D"(uaddr2), "r"(ebp)
                // : "memory"  // would make this safe, but could cause some unnecessary spills.  THIS VERSION IS UNSAFE ON PURPOSE, DO NOT USE.
          );
        
    if (result < 0)
    {
        // Error handling
        return -1;
    }
    return result;
}
正如预期的那样编译。
但是,由于我们没有指定可以读取和/或写入的内存位置,因此可能会导致一些偷偷摸摸的错误。因此,我们可以使用虚拟内存输入和输出( How can I indicate that the memory *pointed* to by an inline ASM argument may be used? )
asm volatile("int $0x80"
             : "=a"(result), "+m"(uaddr2)
             : "a"(SYS_futex), "b"(uaddr), "c"(futex_op), "d"(val), "S"(timeout), "D"(uaddr2), "r"(ebp), "m"(*uaddr), "m"(*timeout));
使用 gcc -m32 编译时,它失败了 'asm' operand has impossible constraints .使用 clang -fomit-frame-pointer -m32 编译时,它失败了 inline assembly requires more registers than available .不过,我不明白为什么。
但是,当使用 -O1 -m32 编译时(或除 -O0 之外的任何级别),它编译得很好。
我看到两个明显的解决方案:
  • 使用 "memory"取而代之的是 clobber,它可能过于严格,阻止编译器将不相关的变量保留在寄存器中
  • 使用 __attribute__((optimize("-O3"))) ,我想避免

  • 还有其他解决方案吗?

    最佳答案

    编译器不知道您实际上并没有使用 *uaddr*timeout操作数,所以它仍然要决定什么 %9%10如果你要使用它们,应该扩展到。这些对象的地址是作为参数传递的,所以不能直接生成内存引用;它必须是间接的,这意味着需要分配寄存器来存储这些地址;例如,编译器可以尝试加载指针 uaddr进入 ecx然后展开 %9(%ecx) .不幸的是,您已经为其他操作数声明了机器的所有寄存器,因此没有可用于此目的的寄存器。
    启用优化后,编译器足够聪明,可以找出指针 uaddr已在 ebx 中可用,所以它可以扩展 %9(%ebx)同样%10(%esi) .然后它不需要任何额外的寄存器,一切都很好。
    如果你真的提到 %9,你就会看到这种情况发生。和 %10在内联汇编中,如 this example .随着优化,它就像我说的那样。如您所知,如果没有优化,它将无法编译,但是如果我们 drop a couple of the other operands为了释放一些寄存器(这里是 ecxedx ),我们看到它现在正在扩展 %7, %8 (他们重新编号)到 (%edx), (%ecx) ,并相应地提前加载这些寄存器。它不知道这是多余的,因为 edxebx两者都包含相同的值。
    除了您已有的想法:启用优化或使用“内存”破坏者之外,我认为没有任何好方法可以避免这种情况。我怀疑“内存”破坏器是否会在如此短的函数中影响生成的代码,无论如何,如果您在没有优化的情况下进行编译,那么您已经放弃了对高效代码的任何希望。或者,只需在汇编中编写整个函数。

    关于c - 内联汇编无法在没有优化的情况下编译,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63023087/

    相关文章:

    linux - 补丁/差异 (linux) 中的 "@@"?

    linux - bash - 转义字符按原样获取字符串

    c++ - Solaris 5.10 x86 CC 链接器错误 : ld: fatal: library -lcryptoki: not found

    linux - 线程在什么情况下会退出或停止运行

    assembly - 从 x86 中的寄存器加载值所花费的时间

    assembly - 嵌入式 x86 程序集中的整数数组

    c - 如何 fork 并创建执行相同任务的特定数量的 child ?

    c - 在 C 中实际的 write() 什么时候发生?

    c - 如何在 SIGABRT 信号处理程序中等待

    c++ - 地震 2 md2 文件格式(理论)