我的问题非常基本。我正在用汇编程序制作我的第一个裸机程序。架构是 ARMv7-M,我使用 GNU as,并使用 UAL 编写。
我在 .bss(或 .data,没关系)中有一个变量声明如下:
.lcomm a_variable, 4
然后我想在程序中的某个地方读取它的值。为此,我首先将其地址加载到寄存器中,然后将变量本身的值加载到另一个寄存器中:
adr r0, a_variable
ldr r1, [r0, #0]
到目前为止一切顺利。编译的对象包含我的 a_variable 符号:
00000000 b a_variable
生成的指令如下所示:
0: f2af 0004 subw r0, pc, #4
4: 6801 ldr r1, [r0, #0]
当我想将对象链接到结果图像时,问题就开始了。 ld 将 a_variable 符号重新定位到新地址的最终 .bss 部分中:
20001074 b a_variable
但最终代码保持不变,程序确实尝试从地址 0x0 读取 a_variable,而不是从 0x20001074 读取。
我希望 ld 以某种方式替换新地址,因为当您链接由 GCC 编译的对象时,它似乎会这样做。我的意思是,如果我编写一段 C 代码做类似的事情:
static int a_variable;
void foo(void)
{
a_variable = 5;
}
...然后我在目标文件中得到以下说明:
0: f240 0300 movw r3, #0
4: f2c0 0300 movt r3, #0
8: 2005 movs r0, #5
a: 6018 str r0, [r3, #0]
...但最终图像如下所示:
800c: f242 338c movw r3, #9100 ; 0x238c
8010: f2c0 0301 movt r3, #1
8014: 2005 movs r0, #5
8016: 6018 str r0, [r3, #0]
So ld 似乎已用真实地址替换了左侧的占位符。
我的问题是为什么这在手写汇编代码的情况下不起作用?我错过了什么?
最佳答案
ADR 指令仅在与同一节和源文件中定义的附近符号(Thumb2 模式下为 +/- 4095)一起使用时才有效。 GNU 汇编器应该在引用不同部分中的符号时给出错误。在 ARM 模式下,您的代码会生成 Error: symbol .bss is in a different section
错误,但显然 GAS 在 Thumb 模式下处理 ADR 指令的方式存在一个错误,导致它默默地接受它。
相反,您可以使用 LDR 或 MOVW/MOVT 指令将任意 32 位常量(包括地址)加载到寄存器中。 LDR 指令会将地址放入常量池中并从那里加载它,而 MOVW/MOVT 指令则分两步形成常量,就像编译器一样。前一条指令仅占用 6 个字节(2 个指令,4 个常量),后两条指令占用 8 个字节。例如:
.syntax unified
.arch armv7-m
.code 16
.bss
.lcomm a_variable, 4
.text
ldr r1, =a_variable
movw r2, #:lower16:a_variable
movt r2, #:upper16:a_variable
组装、链接和拆卸时会给出:
$ arm-linux-gnueabi-as -o test.o test.s
$ arm-linux-gnueabi-ld -Tbss=f0000000 test.o
arm-linux-gnueabi-ld: warning: cannot find entry symbol _start; defaulting to 0000000000010074
$ arm-linux-gnueabi-objdump -d a.out
...
00010074 <.text>:
10074: 4902 ldr r1, [pc, #8] ; (10080 <__bss_start-0x10f80>)
10076: f240 0200 movw r2, #0
1007a: f2cf 0200 movt r2, #61440 ; 0xf000
1007e: 0000 movs r0, r0
10080: f0000000 .word 0xf0000000
关于assembly - GNU 作为 : how to load a . bss/.data 符号到寄存器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31700980/