c - 将 char 作为参数传递给函数将其存储在堆栈上的非默认位置

void myFunc(char dummy) {
    char *addrFirstArg = &dummy;
}

int main() {
    char dummy = 42;
    myFunc(dummy);
    return 0;
}

我在 gdb 下运行上面的代码并在 myFunc 处添加一个断点。我一步计算 addrFirstArg 值并检查它。

我也这样做

info frame

to spit out information about the frame myFunc. As far as my understanding of the C stack implementation goes, I expect that addrFirstArg should be 8 bytes above the base pointer for the frame myFunc.

This is the output that I see:

(gdb) p &dummy
$1 = 0xffffd094 "*\202\f\b\032\004"

(gdb) info frame
Stack level 0, frame at 0xffffd0b0:
 eip = 0x8048330 in findStackBottom (reporter.c:64); saved eip 0x8048478
 called by frame at 0xffffd170
 source language c.
 Arglist at 0xffffd0a8, args: dummy=42 '*'
 Locals at 0xffffd0a8, Previous frame's sp is 0xffffd0b0
 Saved registers:
 ebp at 0xffffd0a8, eip at 0xffffd0ac

(gdb) x/1c 0xffffd0b0
0xffffd0b0:     42 'a'

因此，在 myFunc 帧内，ebp 指向位置 0xffffd0a8，其中 dummy 的地址为 0xffffd094，即低于 ebp 0x14 字节，而不是高于 ebp 0x8 字节。

如果我声明我的虚拟对象是 int 并声明 myFunc 接受 int 参数，这种“差异”就会消失。

我对这种行为非常感兴趣。它是可重现的 - 我运行了很多次。

最佳答案

如果使用gcc -S，您会更好地看到差异；在 char 情况下我们有

char case                       int case (diffs)

pushl   %ebp
movl    %esp, %ebp
subl    $20, %esp               subl    $16, %esp
movl    8(%ebp), %eax           x
movb    %al, -20(%ebp)          x
leal    -20(%ebp), %eax         leal    8(%ebp), %eax
movl    %eax, -4(%ebp)
leave
ret

当进入函数时，堆栈是(顶在顶上):

esp     return address
esp+4   2A 00 00 00

这是因为单个字符以这种方式“推”到堆栈上

movsbl  -1(%ebp), %eax
movl    %eax, (%esp)

x86 是小端字节序。

“序言”之后的情况是这样的

esp            (room for local char dummy - byte 42) ...
...
ebp-4          room for char *
esp+20 = ebp   ebp
ebp+4          return addr
ebp+8          2A 00 00 00

然后将“char”(存储为 32 位整数)从 ebp+8(由主程序“推送”的原始值，但作为“32 位”)取出到 eax，然后将较低的较低有效字节放入在本地存储中。

int 情况更简单，因为我们不需要对齐，并且我们可以“直接”获取堆栈上任何内容的地址。

esp             ...
...
ebp-4          room for int *
esp+16 = ebp   ebp
ebp+4          return addr
ebp+8          2A 00 00 00

因此，在第一种情况(字符情况)中，esp 会再减少 4 个字节以保存单个字符:有一个额外的本地存储。

为什么会这样？

正如您所见，单个字符作为 32 位“整数”(eax) 压入堆栈，并以相同的方式在 eax 中取回。该操作不存在字节顺序问题。

但是，如果它返回 char 的 ebp+8 地址并且机器不是小端字节序怎么办？在这种情况下，ebp+8 指向 00 00 00 2A 并且使用 *dummy 进行引用将给出 0，而不是 42。

因此，一旦“fake int”(无论字节序如何，CPU 都会一致处理的操作)放入寄存器中，LSByte 必须放入本地存储中，以便保证其地址指向该 char (低字节)当被引用时。这就是额外代码的原因以及未使用 ebp+8 的原因:字节序以及地址对齐的要求(例如 00 00 00 2A< 中的 2A 在大端字节序情况下将有一个奇数地址。

关于c - 将 char 作为参数传递给函数将其存储在堆栈上的非默认位置，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10764532/

c - 将 char 作为参数传递给函数将其存储在堆栈上的非默认位置

上一篇：c - 编译 gSOAP 客户端时 undefined reference

下一篇：c - 使用 XOR 属性找出数组中修改的元素