assembly - MOVDQA 和 MOVNTDQA 以及 WB/WC 标记区域的 VMOVDQA 和 VMOVNTDQ 之间有什么区别?

标签 assembly x86 sse simd avx

使用标记为WB(回写)和WC(写合并)的内存的指令之间的主要区别是什么:MOVDQA之间的区别是什么?和 MOVNTDQA ,以及 VMOVDQA 之间的区别是什么和 VMOVNTDQ ?

是不是,对于内存已标记为WC - 指令为[NT]与平常没有什么不同(没有 [NT] ),并且该内存标记为 WB - 指令为 [NT]把它当作内存 WC 使用吗?

最佳答案

您通常会使用 NT写入内存映射 IO(即:GPU 等)时的(非时间)指令,其中内存严格不可缓存且始终直接访问。

通过定期读取和写入,CPU 将在需要时尝试缓存较大的块并将其写入主内存。对于不可缓存的区域(例如 MMIO),写入必须直接进入内存,CPU 不会尝试缓存它们。使用 NT指令向 CPU 提示您可能正在流式传输大量数据(即:到帧缓冲区等),并且当它可以填充整个缓存行时,它将尝试组合这些写入。

“非时间”部分意味着您告诉 CPU 您不打算立即进行写入,而是可以在合理范围内延迟写入,直到足够 NT已发出指令以填充高速缓存行。

据我了解,您也可以使用 NT具有常规回写内存的指令,它不会尝试缓存这些写入,但也会在可以填充一行时尝试流式传输。在写入 WB 内存的情况下,我会说应用程序将非常专业,您需要知道在管理其缓存方面,您可以比 CPU 做得更好。此外,写入不会立即发生,因此之后读回的任何内容都会读取陈旧数据,直到执行组合写入。您需要使用 SFENCE 来管理它说明是否需要刷新任何未完成的组合写入。

最好直接从英特尔那里阅读——他们有很多关于这个主题的信息:

Increasing Memory Throughput With Intel® Streaming SIMD Extensions 4 (Intel® SSE4) Streaming Load

关于assembly - MOVDQA 和 MOVNTDQA 以及 WB/WC 标记区域的 VMOVDQA 和 VMOVNTDQ 之间有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19035677/

相关文章:

c++ - 参数传递和返回值如何在x86上的C/C++中的汇编级别工作?

x86 - 如何像 SSE movlps/movhps 一样将 AVX/AVX2(YMM) 寄存器中的较低或较高值存储到内存中?

assembly - x86 指令 PCLMULQDQ 中的 "P"前缀代表什么?

c - 指针和数组之间的效率(更少的汇编指令不会花费更少的时间)

c - shellcode 中的地址在执行过程中发生变化

c++ - 使用 __m256d 寄存器

c - SSE Comparison Intrinsics - 如何从比较中得到 1 或 0?

assembly - 为什么这段汇编代码在管道中有 2 个停顿而不是 1 个?

c++ - x86-64 汇编程序中的无限循环

assembly - 链接描述文件未按预期跳过字节