c++ - CUDA:同步全局内存读写与计算能力 1.1

标签 c++ c cuda gpgpu

好吧,在 nVidia 论坛 ( https://devtalk.nvidia.com/default/topic/458062/atomicadd-float-float-atomicmul-float-float-/ ) 上找到了解决方案。

谢谢。

最佳答案

序列化可以通过使用Atomic Functions来实现.

Compute Capability 1.1 不支持 float 的 atomicAdd(),但可以基于 atomicCAS()(比较和交换)实现任何原子操作。

关于c++ - CUDA:同步全局内存读写与计算能力 1.1,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15021291/

相关文章:

c++ - 更改函数指针签名并调用它以忽略返回类型是否安全?

c++ - C++ 算法的迭代器类别要求

c++ - 使用 fork() 与 exec() 创建新进程

c - libcurl 的 curl_multi_perform 什么时候开始传输?

arrays - 在cuda GPU cudamalloc中将3D数组转换为1D

c++ - 类方法和参数传递

c++ - 尝试在另一个类的头文件中使用对象,出现 “redefinition of class”错误

c - Spritesheet 动画与视频渲染

cuda子矩阵

带有 optimus 的 cuda 只是为了访问 gpgpu