我很想知道如果我将 cudaMemcpyAsync 中的参数“count”设置为零,即 cudaMemcpyAsync(dst, src, count, cudaMemcpyDeviceToHost, stream) 会发生什么?在我的代码中,该函数返回 cudaSuccess,但副本仍然执行吗?
最佳答案
错误,是的,从源复制到目标的零字节。
但是,由于复制和不复制该特定尺寸之间没有区别,因此无关紧要。
如果您询问零大小缓冲区是否有任何类型的设备到主机通信,那么这是一个未指定的实现细节(尽管我不会在上面打赌,因为它会有点低效) )。
关于cuda - 在 cudaMemcpyAsync 中复制 0 个字节,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11201654/