cuda - atomicAdd()用于在GPU上加倍

我正在GPU上做一个项目，我必须使用atomicAdd()来实现两倍，因为cuda不支持它来实现两倍，因此我使用了NVIDIA提供的以下代码。

__device__ double atomicAdd(double* address, double val)
{
    unsigned long long int* address_as_ull =
                                          (unsigned long long int*)address;
    unsigned long long int old = *address_as_ull, assumed;
    do {
        assumed = old;
        old = atomicCAS(address_as_ull, assumed, 
                        __double_as_longlong(val + 
                        __longlong_as_double(assumed)));
    } while (assumed != old);
    return __longlong_as_double(old);
}

现在我想知道为什么该工具需要一个循环，而(假定!=旧)

最佳答案

基本上是因为实现需要负载，而这不能自动执行。比较和交换操作是的原子版本

(*address == assumed) ? (assumed + val) : *address

无法保证*address上的值在从*address加载值的周期与atomicCAS调用用于存储更新值的周期之间不会改变。如果发生这种情况，*address的值将不会更新。因此，循环确保重复执行这两个操作，直到读取操作与比较交换操作之间的*address处的值没有变化为止，这意味着已进行了更新。

关于cuda - atomicAdd()用于在GPU上加倍，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16077464/

上一篇：ruby-on-rails-4 - 为什么设计生成这种格式的确认 URL？

下一篇：video-streaming - 检测MPEG TS流中的视频帧类型

相关文章：

带有 mingw 的 cuda - 更新

用于常量内存变量使用的 CUDA 5.0 命名空间

c++ - CUDA 运行时错误 4 - 从 CUDA 3.2 更新到 CUDA4 后出现

c++ - 将值分配给原子用户定义结构的数组

c++ - 在 CUDA 内核中使用 char 变量会受到惩罚吗？

cufftcomplex.h 程序员引用/文档

java - java中的 volatile 和原子操作

.net - AutoResetEvent 类型是原子开关的合适选择吗？

c++ - sig_atomic_t 和 std::atomic<> 可以互换吗？

java - "atomic"在编程中是什么意思？