gcc - 了解 gcc 生成的优化汇编代码

标签 gcc assembly

我试图了解设置 -O3 标志时 gcc 执行哪种优化。我很困惑这两行是什么,

xor %esi, %esi
lea 0x0(%esi), %esi

在我看来这是多余的。这里使用 lea 指令有什么意义?

最佳答案

该指令用于填充空间以实现对齐目的。当循环在对齐的地址上开始时,它们会更快,因为处理器将内存加载到解码器中。通过对齐循环和函数的开头,它们更有可能位于这些 block 之一的开头。这可以防止加载先前不会使用的指令,最大化 future 指令的数量,并且可能最重要的是,确保第一条指令完全位于第一个 block 中,因此不需要两次加载来执行它.

编译器知道最好对齐循环,并且有两个选项可以做到这一点。它可以跳转到循环的开头,也可以用无操作填充间隙并让处理器流过它们。跳转指令会破坏指令流,并经常导致现代处理器上的周期浪费,因此不必要地添加它们是不可取的。对于像这样的短距离,不进行任何操作会更好。

x86 架构包含一条专门用于不执行任何操作的指令 nop。然而,这是一个字节长,因此需要多个字节来对齐循环。解码每条指令并确定它没有任何作用需要时间,因此简单地插入另一条没有副作用的较长指令会更快。因此,编译器插入了您所看到的 lea 指令。它绝对没有任何影响,并且由编译器选择以具有所需的精确长度。事实上,最新的处理器具有标准的多字节无操作指令,因此这可能会在解码过程中被识别,甚至永远不会被执行。

关于gcc - 了解 gcc 生成的优化汇编代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19085663/

相关文章:

c - 海湾合作委员会 : linker error : undefined reference while using a constant data shared between two files

c++ - 如何在 Ubuntu Linux 下编译 C++?

python - 汇编和Python之间的传输

assembly - 为什么在检查 0 时使用或代替 cmp

assembly - ARM:stm​​ia 指令比 ldmia 快得多?

c++ - 动态加载的 PIC 共享库具有来自 NPIC 依赖项的运行时未解析符号

C++警告以检测引用字段自身的初始化

linux - Make 找不到当前的交叉编译器

c++ - 在 DLL 中调用非导出函数

c - 微软怎么能说 WinAPI 中一个字的大小是 16 位呢?