gcc - 了解 gcc 生成的优化汇编代码

我试图了解设置 -O3 标志时 gcc 执行哪种优化。我很困惑这两行是什么，

xor %esi, %esi
lea 0x0(%esi), %esi

在我看来这是多余的。这里使用 lea 指令有什么意义？

最佳答案

该指令用于填充空间以实现对齐目的。当循环在对齐的地址上开始时，它们会更快，因为处理器将内存加载到解码器中。通过对齐循环和函数的开头，它们更有可能位于这些 block 之一的开头。这可以防止加载先前不会使用的指令，最大化 future 指令的数量，并且可能最重要的是，确保第一条指令完全位于第一个 block 中，因此不需要两次加载来执行它.

编译器知道最好对齐循环，并且有两个选项可以做到这一点。它可以跳转到循环的开头，也可以用无操作填充间隙并让处理器流过它们。跳转指令会破坏指令流，并经常导致现代处理器上的周期浪费，因此不必要地添加它们是不可取的。对于像这样的短距离，不进行任何操作会更好。

x86 架构包含一条专门用于不执行任何操作的指令 nop。然而，这是一个字节长，因此需要多个字节来对齐循环。解码每条指令并确定它没有任何作用需要时间，因此简单地插入另一条没有副作用的较长指令会更快。因此，编译器插入了您所看到的 lea 指令。它绝对没有任何影响，并且由编译器选择以具有所需的精确长度。事实上，最新的处理器具有标准的多字节无操作指令，因此这可能会在解码过程中被识别，甚至永远不会被执行。

关于gcc - 了解 gcc 生成的优化汇编代码，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19085663/

gcc - 了解 gcc 生成的优化汇编代码

上一篇：matlab - 为什么 MATLAB 中的核平滑函数 ksdenth 会产生大于 1 的值？

下一篇：meteor - 什么是 "atomic unit of data"？