c++ - 对齐和性能

标签 c++ c linux sse libc

用于比较 char *memcmp 的例程 strcmp 是否在内存块(在 x86_64 上)上运行得更快对齐(如何?)? libc 是否为此例程使用 SSE

最佳答案

这取决于对齐很重要或 SIMD 指令可用的架构,通常例程将对前导字节进行操作,然后执行数据允许的尽可能多的宽对齐操作,然后对尾随字节进行操作。

可以通过实验确定前导字节和尾随字节是否显着影响数据的处理时间。

关于c++ - 对齐和性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9077840/

相关文章:

c - 高级叉式炸弹免疫杀伤信号

c - 不错的 C 字符串库

linux - Stracing 附加到多线程进程

linux - 如何针对 Linux 的新 `fanotify` 文件系统监控功能进行编程?

linux - 守护进程如何在不使用内存的情况下保持事件状态?

c++ - Boost::signals2 传递无效数据

c - 编译 pshtoolkit 的问题

c++ - 生成有向无环图的快速算法

c++ - 通过管道将自定义 stdin 传输到 C++ 中的系统调用

c++ - 来自 Qt 中具有倾斜度的线的 BoundingRec