我编写了自己的链接脚本,将不同的变量放入两个不同的数据部分(A 和 B)。
A 链接到零地址; B 链接到代码附近,并且位于高地址空间(高于 4G,这对于 x86-64 中的正常绝对寻址不可用)。
A可以通过绝对寻址来访问,但不能通过RIP相对寻址来访问; B可以通过RIP相对寻址访问,但不能绝对访问;
我的问题:有没有办法为 gcc 中的不同变量选择 RIP 相对或绝对寻址?也许带有一些注释,例如 #pragma
?
最佳答案
如果不破解 GCC 源代码,您将无法让它发出32 位绝对寻址,但在某些情况下,gcc 将使用 64 位绝对地址。
<小时/> -mcmodel=medium
将大对象放入单独的部分,对大数据部分使用 64 位绝对地址。 (所有对象都必须同意大小阈值,由 -mlarge-data-threshold=
设置)。但仍然对所有其他变量使用 RIP 相对值。
有关不同内存模型的更多信息,请参阅 x86-64 System V ABI 文档。和/或 -mcmodel=
的 GCC 文档和-mlarge-data-threshold=
: https://gcc.gnu.org/onlinedocs/gcc/x86-Options.html
默认为-mcmodel=small
:所有内容都在 2GiB 之内,因此 RIP 相对有效。对于非 PIE 可执行文件,这是虚拟地址空间的低 2GiB,因此静态地址可以是 32 位绝对符号或零扩展立即数或寻址模式中的 disp32。
int a[1000000];
int b[1];
int fa() { return a[0]; }
int fb() { return b[0]; }
ASM 输出 ( Godbolt ):
# gcc9.2 -O3 -mcmodel=medium
fa():
movabs eax, DWORD PTR [a] # 64-bit absolute address, special encoding for EAX
ret
fb():
mov eax, DWORD PTR b[rip]
ret
为了加载到 AL/AX/EAX/RAX 以外的寄存器中,GCC 将使用 movabs r64, imm64
与地址,然后使用 mov reg, [reg]
.
您不会让 gcc 对 A 部分使用 32 位绝对寻址。它将始终使用 64 位绝对寻址,从不 [array + rdx*4]
或[abs foo]
(NASM 语法)。从来没有mov edi, msg
(imm32) 用于将地址放入寄存器,始终 mov rdi, qword msg
(imm64)。
GCC 看跌期权b
在 .lbss
部分和 a
常规.bss
。想必你可以使用__attribute__((section("name")))
上
.globl b
.section .lbss,"aw" # "aw" = allocate(?), writeable
.align 32
.size b, 4000000
b:
.zero 4000000
.globl a
.bss # shortcut for .section
.align 4
a:
.zero 4
<小时/>
不起作用的事情:
-
__attribute__((optimize("mcmodel=large")))
基于每个功能。实际上不起作用,并且无论如何都是每个函数而不是每个变量。 https://gcc.gnu.org/onlinedocs/gcc/Variable-Attributes.html不记录与内存模型或大小相关的任何 x86 或常见变量属性。唯一特定于 x86 的变量属性是 ms vs gcc 结构布局。
函数和类型有特定于 x86 的属性,但这些没有帮助。
可能的黑客攻击:
将所有 A 部分变量放入一个大型结构中,比任何 B 部分全局/静态对象都大。可能在末尾用一个虚拟数组填充它以使其更大:您的链接器脚本可能可以避免实际为该虚拟数组分配额外的空间。
然后使用 -mcmodel=medium mlarge-data-threshold=
进行编译那个尺寸。
关于gcc - 我可以在 x86-64 中使用 gcc 为不同变量选择 RIP 相对或绝对寻址吗,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5269367/