c - 将 char 作为参数传递给函数将其存储在堆栈上的非默认位置

标签 c stack callstack cpu-registers

void myFunc(char dummy) {
    char *addrFirstArg = &dummy;
}

int main() {
    char dummy = 42;
    myFunc(dummy);
    return 0;
}

我在 gdb 下运行上面的代码并在 myFunc 处添加一个断点。我一步计算 addrFirstArg 值并检查它。

我也这样做

info frame
to spit out information about the frame myFunc. As far as my understanding of the C stack implementation goes, I expect that addrFirstArg should be 8 bytes above the base pointer for the frame myFunc.

This is the output that I see:

(gdb) p &dummy
$1 = 0xffffd094 "*\202\f\b\032\004"

(gdb) info frame
Stack level 0, frame at 0xffffd0b0:
 eip = 0x8048330 in findStackBottom (reporter.c:64); saved eip 0x8048478
 called by frame at 0xffffd170
 source language c.
 Arglist at 0xffffd0a8, args: dummy=42 '*'
 Locals at 0xffffd0a8, Previous frame's sp is 0xffffd0b0
 Saved registers:
 ebp at 0xffffd0a8, eip at 0xffffd0ac

(gdb) x/1c 0xffffd0b0
0xffffd0b0:     42 'a'

因此,在 myFunc 帧内,ebp 指向位置 0xffffd0a8,其中 dummy 的地址为 0xffffd094,即低于 ebp 0x14 字节,而不是高于 ebp 0x8 字节。

如果我声明我的虚拟对象是 int 并声明 myFunc 接受 int 参数,这种“差异”就会消失。

我对这种行为非常感兴趣。 它是可重现的 - 我运行了很多次。

最佳答案

如果使用gcc -S,您会更好地看到差异;在 char 情况下我们有

char case                       int case (diffs)

pushl   %ebp
movl    %esp, %ebp
subl    $20, %esp               subl    $16, %esp
movl    8(%ebp), %eax           x
movb    %al, -20(%ebp)          x
leal    -20(%ebp), %eax         leal    8(%ebp), %eax
movl    %eax, -4(%ebp)
leave
ret

当进入函数时,堆栈是(顶在顶上):

esp     return address
esp+4   2A 00 00 00

这是因为单个字符以这种方式“推”到堆栈上

movsbl  -1(%ebp), %eax
movl    %eax, (%esp)

x86 是小端字节序。

“序言”之后的情况是这样的

esp            (room for local char dummy - byte 42) ...
...
ebp-4          room for char *
esp+20 = ebp   ebp
ebp+4          return addr
ebp+8          2A 00 00 00       

然后将“char”(存储为 32 位整数)从 ebp+8(由主程序“推送”的原始值,但作为“32 位”)取出到 eax,然后将较低的较低有效字节放入在本地存储中。

int 情况更简单,因为我们不需要对齐,并且我们可以“直接”获取堆栈上任何内容的地址。

esp             ...
...
ebp-4          room for int *
esp+16 = ebp   ebp
ebp+4          return addr
ebp+8          2A 00 00 00       

因此,在第一种情况(字符情况)中,esp 会再减少 4 个字节以保存单个字符:有一个额外的本地存储。

为什么会这样?

正如您所见,单个字符作为 32 位“整数”(eax) 压入堆栈,并以相同的方式在 eax 中取回。该操作不存在字节顺序问题。

但是,如果它返回 char 的 ebp+8 地址并且机器不是小端字节序怎么办?在这种情况下,ebp+8 指向 00 00 00 2A 并且使用 *dummy 进行引用将给出 0,而不是 42。

因此,一旦“fake int”(无论字节序如何,CPU 都会一致处理的操作)放入寄存器中,LSByte 必须放入本地存储中,以便保证其地址指向该 char (低字节)当被引用时。这就是额外代码的原因以及未使用 ebp+8 的原因:字节序以及地址对齐的要求(例如 00 00 00 2A< 中的 2A 在大端字节序情况下将有一个奇数地址。

关于c - 将 char 作为参数传递给函数将其存储在堆栈上的非默认位置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10764532/

相关文章:

java - java中栈元素与对象的比较

c - 键盘布局资源

c++ - new 在堆栈而不是堆上(如 alloca 与 malloc)

使用指针将一个字符串复制到另一个字符串会产生垃圾值,为什么?

c++ - 堆栈在哪里实现?

javascript - 忙等待替代方案

java - 将 Java 程序映射到操作系统进程

objective-c - Xcode - 在断言上调用堆栈跟踪?

C动态分配的数组使用memset进行初始化

C 程序 : Reading from file and copying to a struct?