c - gcc 优化跳过初始化分配的内存

标签 c gcc strict-aliasing

使用 gcc 4.9.2 20150304 64 位我遇到了这个明显奇怪的行为:

double doit() {
    double *ptr = (double *)malloc(sizeof(double));
    ptr[0] = 3.14;
    return (double)((uintptr_t) ptr);
}

在代码中,我在堆上分配一个 double,初始化它,然后返回另一个 double,用第一个转换为 的地址初始化>intptr_t。通过优化 -O2,在 32 位模式下生成以下汇编代码:

sub    $0x28,%esp
push   $0x8                   ;; 8 bytes requested
call   8048300 <malloc@plt>   ;; malloc 'em
movl   $0x0,0x14(%esp)        ;; store zeros in upper 32bits
mov    %eax,0x10(%esp)        ;; store address in lower 32bits
fildll 0x10(%esp)             ;; convert a long long to double
add    $0x2c,%esp
ret    

令人惊讶的是,分配的 double 的初始化完全消失了。

当使用 -O0 生成代码时,一切都按预期工作,相关代码改为:

push   %ebp
mov    %esp,%ebp
sub    $0x28,%esp
sub    $0xc,%esp
push   $0x8                    ;; 8 bytes requested
call   8048300 <malloc@plt>    ;; malloc 'em
add    $0x10,%esp
mov    %eax,-0xc(%ebp)
mov    -0xc(%ebp),%eax
fldl   0x8048578               ;; load 3.14 constant
fstpl  (%eax)                  ;; store in allocated memory
mov    -0xc(%ebp),%eax
mov    %eax,-0x28(%ebp)        ;; store address in low 32 bits
movl   $0x0,-0x24(%ebp)        ;; store 0 in high 32 bits
fildll -0x28(%ebp)             ;; convert the long-long to a double
fstpl  -0x20(%ebp)
fldl   -0x20(%ebp)
leave  
ret    

问题

我是否做了任何无效的事情(我特别考虑别名规则,即使在我看来跳过初始化没有正当理由)或者这只是一个 gcc 错误?

请注意,在编译为 64 位代码时会出现同样的问题(正式的 intptr_t 在 64 位模式下是 8 个字节,因此 ad double 无法准确地表示它...然而这并没有发生,因为在 x86-64 上只使用了 64 位地址中的 48 位并且 double 可以准确地表示所有这些值)。

最佳答案

在 UB 的情况下允许优化删除代码,但这里不应该。

您在 Value *ptr = (Value *)malloc(sizeof(Value)); 中进行了不必要的转换,但这应该是无害的。

这一行 res.d = (unsigned long long) ptr; 最好是 res.d = (intptr_t) ptr;,因为 intptr_t 明确允许接收指针,然后您可以在 double 变量中设置一个整数值:您可能会失去精度,但它不应该是 UB。

我无法测试它(因为我没有 gcc 4.9)但是如果你有同样的问题:

#include <stdint.h>

...

Value doit() {
    Value *ptr = malloc(sizeof(Value));
    ptr[0].u = 7;
    Value res; res.d = (double) ((intptr_t) ptr);
    return res;
}

我会得出一个 gcc 错误的结论。

我可以尝试在 FreeBSD 10.1 上使用 clang 版本 3.4.1 编译代码的简化版本

cc -O3 -S doit.c 给出(剥离到代码部分):

doit:                                   # @doit
# BB#0:
    pushl   %ebp
    movl    %esp, %ebp
    andl    $-8, %esp
    subl    $16, %esp
    movl    $8, (%esp)
    calll   malloc
    movl    $1074339512, 4(%eax)    # imm = 0x40091EB8
    movl    $1374389535, (%eax)     # imm = 0x51EB851F
    movl    %eax, 8(%esp)
    movl    $0, 12(%esp)
    fildll  8(%esp)
    movl    %ebp, %esp
    popl    %ebp
    ret

它与 gcc 的编译不同,但 clang 甚至在 -O3 优化级别进行 3.14 初始化(3.14 的转储十六进制为 0x40091eb851eb851f)


阅读其他评论和答案后,我认为问题的真正原因是 gcc 跳过 中间转换并读取 return (double)((uintptr_t) ptr); as return (double) ptr; - 不完全是因为这会是一个语法错误,但仍然认为存在 UB,因为 在结尾 指针值结束变成双变量。但是,如果我们用 中间转换 分解行,它应该被读作(恕我直言):

register intptr_t intermediate = (intptr_t) ptr; // valid conversion
return (double) intermediate;  // valid conversion

关于c - gcc 优化跳过初始化分配的内存,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30137521/

相关文章:

c - 使用 C 开始使用 wpa_supplicant

c - 查找无序数组的排序版本的 N 个连续元素的最佳方法是什么?

Codeblocks vs GCC 不同的输出(奇怪的行为)?

c++ - 使用(自定义)GCC 4.x 或 5.x 时,Boost 构建无法通过 C++11 功能检查

c++ - 如何正确设置 CMakeLists.txt 文件?

c - 使用 uint16_t* 访问 uint32_t 数组会导致未定义的行为吗?

c - 在Visual Studio 2010中构建C项目时出错

c++ - 关于 C/C++ 解引用运算符

一个对象可以有多个有效类型吗?

c++ - char* 转换和别名规则