c - 使用结构时，如何将以下汇编代码从编译器翻译成 C？

假设我定义了一个新的struct:

struct s {
   int *x;
   struct {
      short sh[2];
      int i;
   } w;
   struct s *next;
};

另外，我写了一个函数来初始化它:

void init_s(struct s *ss) {
   ss->w.sh[1] = /* Line 1 */;
   ss->x = /* Line 2 */;
   ss->next = /* Line 3 */;
}

编译器为init_s生成如下汇编代码:

init_s:             # line 1
   movw 8(%rdi), %ax    # line 2
   movw %ax, 10(%rdi)   # line 3
   leaq 12(%rdi), %rax  # line 4
   movq %rax, (%rdi)    # line 5
   movq %rdi, 16(%rdi)  # line 6
   retq                 # line 7

我想做的是根据程序集为 init_s 填充缺失的代码行。我已经弄清楚(或者至少我认为是)第 1 行和第 2 行。第 1 行应该是 ss->w.sh[0]，第 2 行应该是 &(ss-> w.sh[2])。但是，我在第 3 行遇到了问题。我认为它是 &(ss->x) 基于程序集，但我觉得这是不正确的，我不确定为什么。非常感谢任何反馈或建议，以帮助我更多地了解汇编和结构。

最佳答案

Line 1 should be ss->w.sh[0]

我同意。

line 2 should be &(ss->w.sh[2])

这是正确的地址，除了 ss->w.sh 只有 2 个元素，所以 w.sh[2] 超出范围。这是指向结构的下一个成员的指针，即 ss->x = &(ss->w.i)。这对于 ss->x 成员是 int * 而不是 short * 也是有意义的。

However, I am having trouble with line 3. I think it would be &(ss->x) based on the assembly

类似问题:%rdi 确实可以是指向 ss->x 的指针，但按类型分配 没有意义&ss->x(类型int **)到ss->next(类型struct s *)。您还可以将 %rdi 视为指向结构 *ss 本身的指针，这样更明智:ss->next = ss;。它创建了一个带有单个节点的循环链表，该节点的 next 是它自己。

这里的寓意是，在 C 中可以有不同的方式来引用同一个地址，所有这些方式都将生成相同的程序集，您必须使用常识来做出有根据的猜测，以判断作者更有可能采用哪种方式故意的。从理论上讲，C 代码的作者可能将 ss->next = (struct s *)&(ss->x); 写为第三行 - 我们无法证明他们没有t - 但 ss->next = ss; 更明智，因此更有可能。

正因为如此，逆向工程既是一门艺术又是一门科学。

关于c - 使用结构时，如何将以下汇编代码从编译器翻译成 C？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67360403/

c - 使用结构时，如何将以下汇编代码从编译器翻译成 C？

上一篇：typescript - "Arbitrary"通用类型

下一篇：arrays - 将数组作为 int A[] 而不是 int *A 传递有什么优势吗？