输入矩阵也可以用于存储 CUBLAS 的输出矩阵吗?

标签 c cuda gpgpu cublas

例如, cublas<t>geam() 会做:

C = αop(A) + βop(B)

但是如果我想将结果存储在 A 中怎么办?不管怎样?我可以用指针调用它吗 *C = *A这样:

A = αop(A) + βop(B)

不用担心我可能会将输出写入矩阵,但仍将其作为输入读取??

如果是这样,我们能保证我们安全地对所有其他 CUBLAS 矩阵操作执行此操作吗?

最佳答案

在您发布的 cublas 文档中,答案是正确的 - cublasgeam() - 如果 C 与 A 或 B 重叠,则行为未定义。 如果 C == A,Nvidia 不保证这会起作用。

关于输入矩阵也可以用于存储 CUBLAS 的输出矩阵吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16329997/

相关文章:

c - 在 C 中将字符串从代码存储器存储到 IDATA 存储器 (8051)

c++ - 链接 : fatal error LNK1181: cannot open input file 'libclamav.lib'

CUDA atomicAdd() 产生错误的结果

python - 使用 ArrayFire 的多个主机线程

c++ - 访问 CUDA 中的共享内存

c++ - Mac 地址 c++ osx

通过Makefile在特定目录下创建目标文件

c++ - 如何使用 CUDA 内核更新 OpenGL VBO

cuda - 如何测量 CUDA 中内核启动的开销

cudaMemcpy 无法复制值