c++ - 使 thread_local 变量完全易变

标签 c++ multithreading volatile thread-local boost-context

我正在开发一个使用用户级上下文切换(使用 Boost::Context)的运行时库,但在使用 thread_level 变量时遇到了问题。考虑以下(简化的)代码:

thread_local int* volatile tli;

int main()
{
    tli = new int(1);   // part 1, done by thread 1
    UserLevelContextSwitch();
    int li = *tli;      // part 2, done by thread 2
    cout << li;
}

由于对 thread_local 变量有两次访问,编译器将 main 函数转换为类似以下行的内容(与汇编相反):

register int** ptli = &tli; // cache address of thread_local variable
*ptli = new int(1);
UserLevelContextSwitch();
int li = **ptli;
cout << li;

这似乎是一个合法的优化,因为 volatile tli没有缓存在寄存器中。但是 volatile tli 的地址 实际上被缓存了,而不是在第 2 部分从内存中读取。

这就是问题所在:在用户级上下文切换之后,执行第 1 部分的线程转到其他地方。然后,第 2 部分由其他某个线程获取,该线程获取先前的堆栈并注册状态。但是现在正在执行第 2 部分的线程读取属于线程 1 的 tli 的值。

我正在尝试找到一种方法来防止编译器缓存线程局部变量的地址,而volatile 还不够深入。是否有任何技巧(最好是标准的,可能是特定于 GCC 的)来防止缓存线程局部变量的地址?

最佳答案

无法将用户级上下文切换与 TLS 配对。即使使用原子和完整的内存栅栏,缓存地址似乎也是合理的优化,因为 thread_local 变量是文件范围的静态变量,不能像编译器假设的那样移动。 (虽然,也许某些编译器仍然对编译器内存屏障敏感,例如 std::atomic_thread_fenceasm volatile (""::: "memory");)

使用 the same technique正如您描述的那样,当不同的线程可以在同步点之后继续执行时实现“继续窃取”。而他们explicitly discourage在 Cilk 程序中使用 TLS。相反,他们建议使用“超对象”——Cilk 的一个特殊功能,它替代了 TLS(并且还提供串行/确定性连接语义)。另见 Cilk 开发人员 presentation关于 thread_local 和并行性。

此外,Windows 在 Fibers 时提供 FLS(光纤本地存储)作为 TLS 的替代品。 (相同的轻量级上下文切换)正在使用中。

关于c++ - 使 thread_local 变量完全易变,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25673787/

相关文章:

Java 线程可见性和同步

c++ - 三个一维或一个二维

c++ - 'type' 的初始化没有匹配的构造函数

c++ - 怀疑std::array C++11库坏了?我该怎么办?

multithreading - 为什么 Rust playground 不会为线程产生不同的结果?

asp.net - 我应该将工作卸载到 ASP.NET 中的其他线程吗?

Java 执行器模型,仅允许在实例化线程上运行任务

C - 来自不稳定源的 fwrite()

java - Volatile 变量在这里有意义吗(多核处理器)?

c++ - 无法将新行添加到 Gtk::ListBox