c - asm 中的寄存器数组

标签 c gcc x86 sse inline-assembly

如何在 asm() 中定义指向 XMM 寄存器的指针? 就像在循环中访问数组元素一样,如何使用计数器访问 asm 中的寄存器? 我试着用下面的代码来做:

float *f=(float*)_aligned_malloc(64,16);
for(int i=0;i<4;i++)
    asm volatile
        (
        "movaps (%1),%%xmm%0"
        :
        :"r"(i),"r"(f+4*i)
        :"%xmm%0"
        );

但是编译器给我这个错误:

unknown register name '%xmm%0' in 'asm'

最佳答案

与使用汇编程序宏或实际手动展开相比,这听起来像是一个可怕的想法。如果 gcc 决定不完全展开循环,您的代码将完全中断,因为它只能使用编译时常量索引。

此外,没有办法告诉编译器您将结果放入哪个寄存器,因此这基本上是无用的。我只是作为使用 GNU C 内联汇编语法的愚蠢练习来回答,而不是因为这个答案可能在任何项目中都有用。


就是说,您可以使用 "i" 约束和 a c operand modifier 来做到这一点将立即数格式化为裸数字,例如 1 而不是 $1

void *_aligned_malloc(int, int);
void foo()
{
    float *f=(float*)_aligned_malloc(64,16);
    for(int i=0;i<4;i++) {
        asm volatile (
        "movaps %[input],%%xmm%c[regnum]"
        :
        // only compiles with optimization enabled.
        :[regnum] "i"(i), [input] "m"(f[4*i])
        :"%xmm0", "%xmm1", "%xmm2", "%xmm3"
        );
    }
}

gcc 和 clang 与 -O3 能够完全展开并使每次迭代的 i 成为可以匹配 "i 的编译时常量" 约束。 This compiles on Godbolt .

# gcc7.3 -O3
foo():
    subq    $8, %rsp
    movl    $16, %esi
    movl    $64, %edi
    call    _aligned_malloc(int, int)       # from a dummy prototype so it compiles
    movaps (%rax),%xmm0
    movaps 16(%rax),%xmm1          # compiler can use addressing modes because I switched to an "m" constraint
    movaps 32(%rax),%xmm2
    movaps 48(%rax),%xmm3
    vzeroupper                     # XMM clobbers also include YMM, and I guess gcc assumes you might have dirtied the upper lanes.
    addq    $8, %rsp
    ret

请注意,我只告诉编译器读取每组 4 的第一个 float


ICC -O3 显示 灾难性错误:即使使用 -O3 也无法匹配 asm 操作数约束。当然,在禁用优化的情况下,gcc 和 clang 也有同样的问题。例如,gcc -O0 会说:

<source>: In function 'void foo()':
<source>:11:10: warning: asm operand 0 probably doesn't match constraints
         );
          ^
<source>:11:10: error: impossible constraint in 'asm'
Compiler returned: 1

因为没有优化,i 不是编译时常量,无法匹配 "i"(立即数)约束。


显然您不能使用"r" 约束;如果编译器选择了 eax,这将用类似 %xmm%eax 的内容填充 asm 模板。


无论如何,这是没有用的,因为你不能使用目标寄存器。您所能做的就是告诉编译器所有可能的目标寄存器都被破坏了。在一个 asm 语句中写入一个被破坏的寄存器然后假设该值在后面的 asm 语句中仍然存在是不安全的。

x86 与所有其他架构一样,无法使用运行时值索引架构寄存器。寄存器编号必须硬编码到指令流中。

(某些微 Controller ,如 AVR,具有内存映射寄存器,因此您可以通过索引别名寄存器文件的内存来索引它们。但这种情况很少见,x86 不会这样做。它会干扰输出 -以类似于自修改代码的方式按顺序执行。顺便说一句,SMC(或分支到指令的 16 个不同版本之一)是寄存器文件运行时索引的唯一选项。)

关于c - asm 中的寄存器数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48977313/

相关文章:

c - 奇怪的 MPI 输出

c - 遍历枚举值

c++ - 如何自动打印输入的c++函数参数值

linux - 如何在 x86 平台上运行 MIPS 二进制文件?

x86 - 使用 GDB 读取 MSR

c - FILE 读取链表并排序

c - 我应该如何在二维字符数组中搜索字符?

C++11 Code::Blocks GCC 在编译依赖成员结构的可变参数模板时崩溃

ubuntu - 为什么这个内置类型在编译时会出错?

c - 使用时间戳计数器测量内存延迟