c++ - CUDA:同步全局内存读写与计算能力 1.1

标签 c++ c cuda gpgpu

好吧，在 nVidia 论坛 ( https://devtalk.nvidia.com/default/topic/458062/atomicadd-float-float-atomicmul-float-float-/ ) 上找到了解决方案。

谢谢。

最佳答案

序列化可以通过使用Atomic Functions来实现.

Compute Capability 1.1 不支持 float 的 atomicAdd()，但可以基于 atomicCAS()(比较和交换)实现任何原子操作。

关于c++ - CUDA:同步全局内存读写与计算能力 1.1，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15021291/

上一篇：c - 使用可能重复的键调整单独链接的哈希表的大小

下一篇：c++ - 使用数组时的常见陷阱 : Trusting type-unsafe linking

相关文章：

c++ - 更改函数指针签名并调用它以忽略返回类型是否安全？

c++ - C++ 算法的迭代器类别要求

c++ - 使用 fork() 与 exec() 创建新进程

c - libcurl 的 curl_multi_perform 什么时候开始传输？

arrays - 在cuda GPU cudamalloc中将3D数组转换为1D

c++ - 类方法和参数传递

c++ - 尝试在另一个类的头文件中使用对象，出现 “redefinition of class”错误

c - Spritesheet 动画与视频渲染

带有 optimus 的 cuda 只是为了访问 gpgpu

©2024 IT工具网联系我们