例如, cublas<t>geam()
会做:
但是如果我想将结果存储在 A
中怎么办?不管怎样?我可以用指针调用它吗 *C = *A
这样:
不用担心我可能会将输出写入矩阵,但仍将其作为输入读取??
如果是这样,我们能保证我们安全地对所有其他 CUBLAS 矩阵操作执行此操作吗?
最佳答案
在您发布的 cublas 文档中,答案是正确的 - cublasgeam() - 如果 C 与 A 或 B 重叠,则行为未定义
。
如果 C == A
,Nvidia 不保证这会起作用。
关于输入矩阵也可以用于存储 CUBLAS 的输出矩阵吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16329997/