c++ - 如何故意触摸内存页?

标签 c++ c multithreading memory-mapped-files

首先,在有人提示之前,我意识到在理论上完美的C++代码的角度来看,内存模型是一个我不应该依赖的实现细节。但是,我更喜欢表现而不是纪律。

场景是这样的:我有一个地址空间区域,我告诉操作系统用我选择的文件来支持它——也就是说,该文件是内存映射的。如果我对 VMM 通常如何工作的理解是正确的,那么操作系统可能会很懒惰地将页面加载到我的映射中,并且可能只会在页面实际被触及时才这样做。

通常我可以忽略这个细节,但在这种特殊情况下,我将映射数据发送到工作线程池中。如果我只是天真地向工作线程传递一个指向该缓冲区的指针,那么很有可能工作线程本身会在第一次触摸页面时遇到页面错误,这将导致工作线程阻塞,直到页面被物理访问由 VMM 加载。

工作池的设计使得它的线程在 I/O 上阻塞是非常糟糕的,而发送作业的线程可以容忍被阻塞。因此,我想让我的发送者线程首先接触映射的页面,这样页面错误就会阻止它。

(我知道没有保证先触摸页面会停止工作线程中的后续页面错误,但程序仍然会在大多数时间处于最佳状态并始终纠正.)

在 x86 汇编语言中,这将是微不足道的:

; get the page's address in ebx
mov al, Byte Ptr [ebx]

不幸的是,在 C 或 C++ 中就没那么简单了。天真的实现很简单:

char *pPage = ...;
char Dummy = *pPage;

但是,这可能行不通,因为任何有自尊心的优化器都会意识到代码什么都不做而只是忽略它。

我们可以使用内联汇编,但这可能会严重削弱优化器。我们可以调用一个汇编语言函数来完成它,但是我们有(公认的小)不必要的函数调用开销。

我们可以改为使 Dummy 成为一个外部可见的变量,这会起作用,因为编译器不能假定赋值是无意义的。但是,这会导致对包含 Dummy 的 CPU 缓存行的争用,从而严重降低多核系统的性能。 (更不用说,我们浪费了缓存行和访问权限。)

我也想到了这样做:

char volatile *pPage = ...;
char Dummy = *pPage;

我知道 volatile 关键字有两个保证:

  • 编译器不会重新排序访问;和

  • 编译器不会假定连续读取之间的值相同。

但是,这似乎并不能保证编译器即使不需要它也会读取该值。

有什么想法吗?

最佳答案

volatile 根据定义保证执行内存访问,因此一个简单的解决方案正是您所建议的:

volatile char *prefetch_me = ...;
(void)*prefetch_me;

但是,如果您想以(可能)更有效的方式访问多个页面(并且您在 *ix 系统上运行),请查看 madvise() ,特别是 MADV_WILLNEED 和/或 MADV_SEQUENTIAL。从手册页:

  • MADV_WILLNEED - 期望在不久的将来访问。 (因此,提前阅读几页可能是个好主意。)
  • MADV_SEQUENTIAL - 期望页面引用按顺序排列。 (因此,给定范围内的页面可以被积极地提前读取,并可能在访问后很快被释放。)

关于c++ - 如何故意触摸内存页?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18929011/

相关文章:

c - ‘;’ token 之前的错误 : expected ‘,’ , ‘)’ 或 ‘&’

multithreading - 我怎么知道多线程何时完成(Swift)

java - 对学习 Java 并发的程序或小项目有什么建议吗?

c++ - 右递归文法还是左递归文法?

c++ - 使用 if, then 语句的问题

java - 来自 Java 的 clang 的 `pkg-config` 参数

c - Mac 上连接字符集时出现总线错误 10

c++ - Qt:将 QPixmap 保存到 std::vector<unsigned char> - 或将 QByteArray 转换为 std::vector<unsigned char>

c++ - 找到找到的圆opencv的半径

java - 等待线程的开销是多少?