algorithm - 这个循环优化叫什么,它是如何工作的?

标签 algorithm loops gcc optimization

我正在编译以下代码:

#include <stdio.h>
#include <string.h>

int main()
{
  char data[1024];
  scanf("%s", data);

  for (int i = 0; i < strlen(data); i++)
  {
    if (data[i] == 'a')
    {
      printf("%d.\n", i);
    }
  }
}

我正在对 GCC 使用 -O2 优化级别。当检查 gdb 如何在汇编级别完成内部循环时,我在 scanf 之后得到以下指令:

0x40055c:   48 89 e0    mov    %rsp,%rax

然后是迭代的代码:

0x40055f <main+47>      mov    (%rax),%ecx 
0x400561 <main+49>      add    $0x4,%rax
0x400565 <main+53>      lea    -0x1010101(%rcx),%edx
0x40056b <main+59>      not    %ecx
0x40056d <main+61>      and    %ecx,%edx
0x40056f <main+63>      and    $0x80808080,%edx
0x400575 <main+69>      je     0x40055f <main+47> 

我就想问一下,这个优化怎么调用?所以我可以阅读它而不是尝试对汇编代码的工作方式进行逆向工程。

附言我理解这个想法是一次移动 4 个字节而不是一个字节,因此它必须进行更少的迭代,但它是如何调用的以及它是如何工作的?

最佳答案

需要说明的是,那是 strlen,而不是您的循环。

这是基于这个 SWAR 的优化字包含零字节技巧,发现here在其他地方:

#define haszero(v) (((v) - 0x01010101UL) & ~(v) & 0x80808080UL)

由于 strlen 是一个内在函数,这可能不是由任何著名的“命名优化”引起的,它是针对特定函数的特定技巧。

关于algorithm - 这个循环优化叫什么,它是如何工作的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51722793/

相关文章:

java - java中动态创建新对象

c - 我需要为编译器指定一个间接使用的库吗?

c++ - gcc - 删除 "is used uninitialized in this function"警告

algorithm - 如何计算文件的熵?

java - While 循环不工作

java - 生成系列 {1,3,9,27,....} 的子集并按总和的升序排列子集

python - 在python中递归定义函数

c - 找出由 `gcc hello_world.c -S` 生成的汇编语言类型

c++ - lambda 表达式语法错误

c - 在有序对结构数组上实现二进制搜索