cuda - 在 cudaMemcpyAsync 中复制 0 个字节

标签 cuda

我很想知道如果我将 cudaMemcpyAsync 中的参数“count”设置为零,即 cudaMemcpyAsync(dst, src, count, cudaMemcpyDeviceToHost, stream) 会发生什么?在我的代码中,该函数返回 cudaSuccess,但副本仍然执行吗?

最佳答案

错误,是的,从源复制到目标的零字节

但是,由于复制和不复制该特定尺寸之间没有区别,因此无关紧要。

如果您询问零大小缓冲区是否有任何类型的设备到主机通信,那么这是一个未指定的实现细节(尽管我不会在上面打赌,因为它会有点低效) )。

关于cuda - 在 cudaMemcpyAsync 中复制 0 个字节,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11201654/

相关文章:

c++ - 两个几乎相同的调用,一个有效,一个失败

testing - CUDA,测试吞吐量的小程序

使用 CMake 编译 CU 和 C 文件

CUDA输出变量始终为0

CUDA 内核随机失败,但仅当我使用某些超越函数时

c++ - CUDA 函数不改变数据

CUDA线程执行顺序

c++ - 将树复制到 GPU 内存

CUDA C 代码上的 C++ 关键字

c++ - 计算机视觉算法的 CUDA 性能