好吧,在 nVidia 论坛 ( https://devtalk.nvidia.com/default/topic/458062/atomicadd-float-float-atomicmul-float-float-/ ) 上找到了解决方案。
谢谢。
最佳答案
序列化可以通过使用Atomic Functions来实现.
Compute Capability 1.1 不支持 float 的 atomicAdd(),但可以基于 atomicCAS()(比较和交换)实现任何原子操作。
关于c++ - CUDA:同步全局内存读写与计算能力 1.1,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15021291/