c - 这个反汇编输出如何与函数源相关联？

<分区>

我在 C 中有以下函数:

    uint    myFunction (uint    arrayLen,
             uint*  array
            )
{
  uint  i;
  uint  j;
  uint  sum = 0;

  for  (i = 0;  i < arrayLen/2;  i++)
    for  (j = 0;  j < arrayLen;  j++)
        if  (array[i*2] == array[j])
          sum += mySumFunction(arrayLen,array,6);

  mySortFunction(arrayLen,array);

  for  (i = 0;  i < arrayLen/2;  i++)
    for  (j = 0;  j < arrayLen;  j++)
        if  (array[i*2] == array[j])
          sum -= mySumFunction(arrayLen,array,7);

  return(sum);
}

下面是函数反汇编命令的输出

 Dump of assembler code for function myFunction:
0x080486a8 <myFunction+0>:  push   %ebp
0x080486a9 <myFunction+1>:  mov    %esp,%ebp
0x080486ab <myFunction+3>:  sub    $0x1c,%esp
0x080486ae <myFunction+6>:  call   0x8048418 <mcount@plt>
0x080486b3 <myFunction+11>: movl   $0x0,-0x4(%ebp)
0x080486ba <myFunction+18>: movl   $0x0,-0xc(%ebp)
0x080486c1 <myFunction+25>: jmp    0x8048713 <myFunction+107>
0x080486c3 <myFunction+27>: movl   $0x0,-0x8(%ebp)
0x080486ca <myFunction+34>: jmp    0x8048707 <myFunction+95>
0x080486cc <myFunction+36>: mov    -0xc(%ebp),%eax
0x080486cf <myFunction+39>: shl    $0x3,%eax
0x080486d2 <myFunction+42>: add    0xc(%ebp),%eax
0x080486d5 <myFunction+45>: mov    (%eax),%edx
0x080486d7 <myFunction+47>: mov    -0x8(%ebp),%eax
0x080486da <myFunction+50>: shl    $0x2,%eax
0x080486dd <myFunction+53>: add    0xc(%ebp),%eax
0x080486e0 <myFunction+56>: mov    (%eax),%eax
0x080486e2 <myFunction+58>: cmp    %eax,%edx
0x080486e4 <myFunction+60>: jne    0x8048703 <myFunction+91>
0x080486e6 <myFunction+62>: movl   $0x6,0x8(%esp)
0x080486ee <myFunction+70>: mov    0xc(%ebp),%eax
0x080486f1 <myFunction+73>: mov    %eax,0x4(%esp)
0x080486f5 <myFunction+77>: mov    0x8(%ebp),%eax
0x080486f8 <myFunction+80>: mov    %eax,(%esp)
0x080486fb <myFunction+83>: call   0x8048668 <mySumFunction>
0x08048700 <myFunction+88>: add    %eax,-0x4(%ebp)
0x08048703 <myFunction+91>: addl   $0x1,-0x8(%ebp)
0x08048707 <myFunction+95>: mov    -0x8(%ebp),%eax
0x0804870a <myFunction+98>: cmp    0x8(%ebp),%eax
0x0804870d <myFunction+101>:    jb     0x80486cc <myFunction+36>
0x0804870f <myFunction+103>:    addl   $0x1,-0xc(%ebp)
0x08048713 <myFunction+107>:    mov    0x8(%ebp),%eax
0x08048716 <myFunction+110>:    shr    %eax
0x08048718 <myFunction+112>:    cmp    -0xc(%ebp),%eax
0x0804871b <myFunction+115>:    ja     0x80486c3 <myFunction+27>
0x0804871d <myFunction+117>:    mov    0xc(%ebp),%eax
0x08048720 <myFunction+120>:    mov    %eax,0x4(%esp)
0x08048724 <myFunction+124>:    mov    0x8(%ebp),%eax
0x08048727 <myFunction+127>:    mov    %eax,(%esp)
0x0804872a <myFunction+130>:    call   0x80485cc <mySortFunction>
0x0804872f <myFunction+135>:    movl   $0x0,-0xc(%ebp)
0x08048736 <myFunction+142>:    jmp    0x8048788 <myFunction+224>
0x08048738 <myFunction+144>:    movl   $0x0,-0x8(%ebp)
0x0804873f <myFunction+151>:    jmp    0x804877c <myFunction+212>
0x08048741 <myFunction+153>:    mov    -0xc(%ebp),%eax
0x08048744 <myFunction+156>:    shl    $0x3,%eax
0x08048747 <myFunction+159>:    add    0xc(%ebp),%eax
0x0804874a <myFunction+162>:    mov    (%eax),%edx
0x0804874c <myFunction+164>:    mov    -0x8(%ebp),%eax
0x0804874f <myFunction+167>:    shl    $0x2,%eax
0x08048752 <myFunction+170>:    add    0xc(%ebp),%eax
0x08048755 <myFunction+173>:    mov    (%eax),%eax
0x08048757 <myFunction+175>:    cmp    %eax,%edx
0x08048759 <myFunction+177>:    jne    0x8048778 <myFunction+208>
0x0804875b <myFunction+179>:    movl   $0x7,0x8(%esp)
0x08048763 <myFunction+187>:    mov    0xc(%ebp),%eax
0x08048766 <myFunction+190>:    mov    %eax,0x4(%esp)
0x0804876a <myFunction+194>:    mov    0x8(%ebp),%eax
0x0804876d <myFunction+197>:    mov    %eax,(%esp)
0x08048770 <myFunction+200>:    call   0x8048668 <mySumFunction>
0x08048775 <myFunction+205>:    sub    %eax,-0x4(%ebp)
0x08048778 <myFunction+208>:    addl   $0x1,-0x8(%ebp)
0x0804877c <myFunction+212>:    mov    -0x8(%ebp),%eax
0x0804877f <myFunction+215>:    cmp    0x8(%ebp),%eax
0x08048782 <myFunction+218>:    jb     0x8048741 <myFunction+153>
0x08048784 <myFunction+220>:    addl   $0x1,-0xc(%ebp)
0x08048788 <myFunction+224>:    mov    0x8(%ebp),%eax
0x0804878b <myFunction+227>:    shr    %eax
0x0804878d <myFunction+229>:    cmp    -0xc(%ebp),%eax
0x08048790 <myFunction+232>:    ja     0x8048738 <myFunction+144>
0x08048792 <myFunction+234>:    mov    -0x4(%ebp),%eax
0x08048795 <myFunction+237>:    leave  
0x08048796 <myFunction+238>:    ret    
End of assembler dump.

我想知道是否有人可以帮助我阅读汇编指令并将其翻译成上面的 C 代码。我专门寻找有关代码 (arrayLen/2) 中看到的除法部分的解释。我的印象是它会转化为右移指令，但是当我在汇编代码中没有看到它时，我不确定发生了什么。

编辑:我添加了缺少的汇编代码。看起来我也找到了除法部分的解释。

最佳答案

看起来你没有完整的功能，但这里有一个细目:

这 3 条指令设置您的堆栈框架:

0x080486a8 <myFunction+0>:  push   %ebp
0x080486a9 <myFunction+1>:  mov    %esp,%ebp
0x080486ab <myFunction+3>:  sub    $0x1c,%esp

我不确定这是干什么的:

0x080486ae <myFunction+6>:  call   0x8048418 <mcount@plt>

这是 i 和 sum 初始化为 0(它们存储在堆栈中):

0x080486b3 <myFunction+11>: movl   $0x0,-0x4(%ebp)
0x080486ba <myFunction+18>: movl   $0x0,-0xc(%ebp)

这是外部 for 循环的开始。通常，汇编中的循环以跳转到结尾开始。在这种情况下，结尾超过了汇编列表的结尾。

0x080486c1 <myFunction+25>: jmp    0x8048713 <myFunction+107>

这是 j 被初始化为 0。它在这里完成是因为每次外部 for 循环运行时都必须重置它。

0x080486c3 <myFunction+27>: movl   $0x0,-0x8(%ebp)

这是内部 for 循环的开始。

0x080486ca <myFunction+34>: jmp    0x8048707 <myFunction+95>

通过对数组的地址进行指针运算，以 i*2 对数组进行索引。首先它把 i 放入 eax，然后左移它 3(乘以 8)。这是对 *2 以及数组 (4) 元素大小的优化。最后将其添加到数组的地址中，将结果存储在 eax 中。

0x080486cc <myFunction+36>: mov    -0xc(%ebp),%eax
0x080486cf <myFunction+39>: shl    $0x3,%eax
0x080486d2 <myFunction+42>: add    0xc(%ebp),%eax

这将获取上面计算的地址指向的值并将其存储在 edx 中。在这种汇编语言中，x(y) 表示 *(y+x)

0x080486d5 <myFunction+45>: mov    (%eax),%edx

这会以类似的方式计算 array[j]，这次将结果存储在 eax 中:

0x080486d7 <myFunction+47>: mov    -0x8(%ebp),%eax
0x080486da <myFunction+50>: shl    $0x2,%eax
0x080486dd <myFunction+53>: add    0xc(%ebp),%eax
0x080486e0 <myFunction+56>: mov    (%eax),%eax

检查上面的两个计算是否相等:

0x080486e2 <myFunction+58>: cmp    %eax,%edx

如果检查没有通过(如果它们不相等)，跳过 if 的内部。 (这会跳过您列表的末尾)jne 表示“如果不相等则跳转”

0x080486e4 <myFunction+60>: jne    0x8048703 <myFunction+91>

这些指令将 mySumFunction 的参数加载到适当的位置:

0x080486e6 <myFunction+62>: movl   $0x6,0x8(%esp)
0x080486ee <myFunction+70>: mov    0xc(%ebp),%eax
0x080486f1 <myFunction+73>: mov    %eax,0x4(%esp)

如果 list 在这里被截断了，但希望这能给您一个好的总体思路。

关于c - 这个反汇编输出如何与函数源相关联？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/8920824/

上一篇：c - 隐藏在 C 中的范围

下一篇：c - 这个lseek, fseek, read, fread有什么区别？

相关文章：

c - 返回char数组中数字的递归函数

javascript - 如何克服javascript的56位限制

c - 反转字符串的函数将字符串更改为空，而不是反转

assembly - 为什么 BIOS 需要在第二条指令中将(看似)随机地址中的值与零进行比较？

gcc - printf 在使用较旧 gcc 的 x86-64 Linux 上陷入 AL = 10 的无限循环

assembly - assembly 中的斐波那契实现给出了意想不到的结果

assembly - MASM (8086) 汇编语言行延续

C 使用 Linux shell 函数

c - 程序集中局部变量的大小

linux - asm ("pause") 是做什么的以及为什么要使用它