用于比较 char *
和 memcmp
的例程 strcmp
是否在内存块(在 x86_64 上)上运行得更快对齐(如何?)? libc 是否为此例程使用 SSE
?
最佳答案
这取决于对齐很重要或 SIMD 指令可用的架构,通常例程将对前导字节进行操作,然后执行数据允许的尽可能多的宽对齐操作,然后对尾随字节进行操作。
可以通过实验确定前导字节和尾随字节是否显着影响数据的处理时间。
关于c++ - 对齐和性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9077840/