c++ - 使用 MMX 指令处理字符串

标签 c++ gcc memory simd mmx

我正在尝试实现一个高性能的 C++ 程序,每个周期我将 8 个字节加载到 MMX 寄存器然后处理它们,但是当然我想在到达字符串末尾时停止。

所以这是我找到的解决方案,每个循环加载8个字节,每个字节与\0进行比较,如果有\0则采取预防措施。这样做的问题是,如果我的数据是 4 个字节,并且在第一个周期我加载 8 个字节,然后我从另一个应用程序内存空间加载 4 个字节。

这会给我带来麻烦吗?或者只是“噪音”来自这些字节,这对我来说是完全可以接受的,因为我会在了解\0 字符后立即处理它。

最佳答案

SSE2 自 2001 年以来一直存在,现在基本上得到普遍支持,但也许您有充分的理由坚持使用 MMX(也许针对嵌入式 P3?)

无论如何,问题在 SSE2 中仍然存在,是的,执行可以扩展到已知有效内存区域之外的任意加载是不好的。 C++ 坚持认为超出它的任何加载都是不好的,但在实践中,它能产生任何影响的唯一方法是,如果你触摸下一页,它是无效的。

使用对齐加载(MMX 不区分对齐加载和未对齐加载,但您当然仍然可以对齐地址)确保如果您加载的第一个字节在有效页面上,那么最后一个字节也是。因此,如果您首先逐字节处理直到到达对齐地址,然后继续对齐加载,就没问题。

关于c++ - 使用 MMX 指令处理字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33915727/

相关文章:

C++ <algorithm> 置换

c++ - 有没有办法在声明时用缓冲区初始化数组?

MySQL 使用的内存比在 Docker 容器中配置的内存多

c++ - 位操作,置换位

c++ - C++动态调用函数的方法

linux - 使用 automake 设置每个文件的标志

c++ - 防止控制台应用程序中的内存工作集最小化?

无法在 "C"中找到变量的空间(100 字节)

c - 体系结构 x86_64 的 undefined symbol : "_read_line", 从 : _insert in inventory-82371b. o 引用

c - gcc mips 带符号的字节算术