c - 从非 void 函数的末尾掉落时写入未使用的参数的返回值

标签 c gcc x86 return-value kernighan-and-ritchie

在此golfing answer我看到一个技巧,其中返回值是未传入的第二个参数。

int f(i, j) 
{
    j = i;   
}

int main() 
{
    return f(3);
}

来自 gcc's assembly output看起来当代码复制 j = i 时,它会将结果存储在 eax 中,这恰好是返回值。

f:
        pushq   %rbp
        movq    %rsp, %rbp
        movl    %edi, -4(%rbp)
        movl    %esi, -8(%rbp)
        movl    -4(%rbp), %eax
        movl    %eax, -8(%rbp)
        nop
        popq    %rbp
        ret
main:
        pushq   %rbp
        movq    %rsp, %rbp
        movl    $3, %edi
        movl    $0, %eax
        call    f
        popq    %rbp
        ret 

那么,这只是幸运的结果吗?这是gcc记录的吗?它只适用于-O0,但它适用于我尝试过的一堆i值,-m32,以及一堆不同的版本海湾合作委员会。

最佳答案

gcc -O0 喜欢计算返回值寄存器中的表达式,如果根本需要一个寄存器。(GCC -O0 通常只是喜欢在 retval 寄存器中有值,但这超出了选择它作为第一个临时值的范围。)

我测试了一下,看起来 GCC -O0 确实有意跨多个 ISA 执行此操作,有时甚至使用额外的 mov 指令或等效指令。 IIRC 我使表达式更复杂,因此评估结果最终在另一个寄存器中,但它仍然将其复制回 retval 寄存器。

x++ 这样可以(在 x86 上)编译为内存目标 inc 或 add 的东西不会将值留在寄存器中,但赋值通常会。所以值得注意的是,GCC 正在处理像 GNU C statement-expressions 这样的函数体。 .


没有被任何东西记录、保证或标准化。这是一个实现细节,而不是让您像这样利用的东西。

以这种方式“返回”一个值意味着您正在使用“GCC -O0”而不是 C 进行编程。代码高尔夫规则的措辞表明程序必须至少在一个上运行执行。但我的理解是,它们应该出于正确的原因 工作,而不是因为一些副作用实现细节。他们打破 clang 并不是因为 clang 不支持某些语言特性,只是因为它们甚至不是用 C 语言编写的。

启用优化的中断也不酷;某种级别的 UB 在代码高尔夫中通常是可以接受的,例如整数环绕或指针转换类型的双关语是人们可能合理希望定义明确的东西。但这纯粹是滥用一个编译器的实现细节,而不是语言特性。

我在 the relevant answer on Codegolf.SE C golfing tips Q&A 下的评论中争论了这一点(错误地声称它可以在 GCC 之外工作)。这个答案有 4 个反对票(在 IMO 上值得更多),但有 16 个赞成票。所以一些社区成员不同意这是可怕和愚蠢的。


有趣的事实:在 ISO C++(但不是 C)中,在非 void 函数的末尾执行失败是未定义的行为,即使调用者没有't 使用结果。即使在 GNU C++ 中也是如此;在 -O0 之外 GCC 和 clang 有时会发出类似 ud2 的代码(非法指令),用于到达函数末尾的执行路径而没有 return。因此,GCC 通常不会在这里定义行为(对于 ISO C 和 C++ 未定义的事情,哪些实现允许执行。例如,gcc -fwrapv 将有符号溢出定义为 2 的补码环绕。)

但是在 ISO C 中,从非 void 函数的末尾掉落是合法的:它只有在调用者使用返回值时才变成 UB。如果没有 -Wall,GCC 甚至可能不会发出警告。 Checking return value of a function without return statement

禁用优化后,函数内联将不会发生,因此 UB 并不是真正的编译时可见的。 (除非您使用 __attribute__((always_inline)))。


传递第二个 arg 只是给你东西分配给。它是一个函数参数并不重要。但是 i=i; 即使使用 -O0 也会进行优化,因此您确实需要一个单独的变量。也只是 i; 优化掉。

有趣的事实:递归 f(i){ f(i); } 函数体在将 i 复制到第一个 arg 传递寄存器之前通过 EAX 反弹。所以 GCC 真的很喜欢 EAX。

        movl    -4(%rbp), %eax
        movl    %eax, %edi
        movl    $0, %eax             # without a full prototype, pass # of FP args in AL
        call    f

i++; 没有载入 EAX;它只是使用一个内存目标 add 而不加载到寄存器中。值得尝试使用 gcc -O0 for ARM。

关于c - 从非 void 函数的末尾掉落时写入未使用的参数的返回值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57437831/

相关文章:

linux - 是否可以使用 `as` 组装和运行原始 CPU 指令?

c - 打印数组值,无地址

C - realloc 导致结构问题

C 程序 - 求 2 的指数的最简单方法是什么

c - 使用 GCC 的两个有符号 64 位乘法

c - 在简单程序上使用ftrace,内联汇编__asm __(“leave”)导致段错误

assembly - "enter"vs "push ebp; mov ebp, esp; sub esp, imm"和 "leave"vs "mov esp, ebp; pop ebp"

c - 两段代码,一段有效,一段无效,为什么?

c - 重定位二进制代码时出错(gcc -> objdata -> 加载二进制代码 -> 并执行)

c - Scanf 在 C 中跳过每隔一个 while 循环