c - 什么是 *ABS* 部分以及何时使用?

标签 c gcc binary linker elf

// foo.c
int main() { return 0; }

当我编译上面的代码时,我注意到 *ABS* 中有一些符号:

$ gcc foo.c
$ objdump -t a.out | grep ABS
0000000000000000 l    df *ABS*  0000000000000000              crtstuff.c
0000000000000000 l    df *ABS*  0000000000000000              foo.c
0000000000000000 l    df *ABS*  0000000000000000              crtstuff.c
0000000000000000 l    df *ABS*  0000000000000000              

看起来它们是一些调试符号,但调试信息不​​是存储在 .debug_info 部分之类的地方吗?

根据man objdump:

*ABS* if the section is absolute (ie not connected with any section)

我不明白,因为这里没有给出例子。

问题 here展示了一种通过 --defsym*ABS* 中传递一些额外符号的有趣方式。但我认为传递宏会更容易。

那么这个 *ABS* 部分是什么,什么时候会有人使用它?

编辑:

Absolute symbols don't get relocated, their virtual addresses (0000000000000000 in the example you gave) are fixed.

我写了个demo,好像是可以修改绝对符号的地址。

// foo.c

#include <stdio.h>

extern char foo;

int main()
{
  printf("%p\n", &foo);
  return 0;
}
$ gcc foo.c -Wl,--defsym,foo=0xbeef -g

$ objdump -t a.out | grep ABS
0000000000000000 l    df *ABS*  0000000000000000              crtstuff.c
0000000000000000 l    df *ABS*  0000000000000000              foo.c
0000000000000000 l    df *ABS*  0000000000000000              crtstuff.c
0000000000000000 l    df *ABS*  0000000000000000
000000000000beef g       *ABS*  0000000000000000              foo

# the addresses are not fixed
$ ./a.out
0x556e06629eef
$ ./a.out
0x564f0d7aeeef
$ ./a.out
0x55c2608dceef

# gdb shows that before entering main(), &foo == 0xbeef
$ gdb a.out
(gdb) p &foo
$1 = 0xbeef <error: Cannot access memory at address 0xbeef>
(gdb) br main
Breakpoint 1 at 0x6b4: file foo.c, line 7.
(gdb) r
Starting program: /home/user/a.out

Breakpoint 1, main () at foo.c:7
7         printf("%p", &foo);
(gdb) p &foo
$2 = 0x55555555feef <error: Cannot access memory at address 0x55555555feef>

最佳答案

如果您查看其他符号,您可能会找到索引(如果读者为您进行映射,则为部分名称)代替 *ABS*。这是节标题表中的节索引。它指向该符号在其中定义的节的节标题(或 SHN_UNDEF(零),如果它在您正在查看的对象中未定义)。因此,符号的值(虚拟地址)将根据加载期间调整其包含部分的相同值进行调整。 (此过程称为重定位。)绝对符号并非如此(具有特殊值 SHN_ABS 作为它们的 st_shndx)。绝对符号不会重新定位,它们的虚拟地址(在您给出的示例中为 0000000000000000)是固定的。

这样的绝对符号有时用来存储一些元信息。特别是,编译器可以创建符号名称等同于它编译的翻译单元名称的符号。链接或运行程序不需要此类符号,它们仅供人类和二进制处理工具使用。

至于你的问题 w.r.t 它没有存储在 .debug_info 部分的原因(以及为什么即使没有指定调试开关也会发出这个信息),答案是它是一个单独的事物;它只是符号表 (.symtab)。当然,调试也需要它,但它的主要目的是链接对象 (.o) 文件。默认情况下,它保存在链接的可执行文件/库中。你可以用 strip 去掉它。

我在这里写的大部分内容都在 man 5 elf 中。


我认为您正在做的事情(使用--defsym)不支持/不应该与动态链接一起工作。查看编译器输出 (gcc -S -masm=intel),我看到了这个

lea     rsi, foo[rip]

或者,如果我们查看 objdump -M intel -rD a.out(与 -q 链接以保留重定位),我们会看到相同的内容:rip-相对寻址用于获取foo的地址。

113d:       48 8d 35 ab ad 00 00    lea    rsi,[rip+0xadab]        # beef <foo>
                    1140: R_X86_64_PC32     foo-0x4

编译器不知道它会成为一个绝对符号,所以它会生成它所做的代码(对于普通符号)。 rip是指令指针,所以它取决于程序被ld.so映射到内存后,包含.text的段的基地址>.

我找到了这个 answer阐明绝对符号的正确用例。

关于c - 什么是 *ABS* 部分以及何时使用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56035556/

相关文章:

c++ - QT creator gcc cout 在终端

ios - 如何在 Linux/Windows 上构建 Apple 的 GCC?

c - 计算任意大二进制数之和的最快方法是什么

c++ - 在 c 中使用 realloc

c++ - 在构建我的 C++ 可执行文件 (gcc) 时,我可以获得所有链接库的报告吗? (包括静态链接)

调用 Lua 函数

java - 用两个字节存储日期

c++ - 2s补码是一种存储负数的方法吗?

c++ - 英特尔线程 C API

C HTTP 流媒体服务器流式传输音频分贝级别