输入矩阵也可以用于存储 CUBLAS 的输出矩阵吗？

例如， cublas<t>geam() 会做:

C = αop(A) + βop(B)

但是如果我想将结果存储在 A 中怎么办？不管怎样？我可以用指针调用它吗 *C = *A这样:

A = αop(A) + βop(B)

不用担心我可能会将输出写入矩阵，但仍将其作为输入读取？？

如果是这样，我们能保证我们安全地对所有其他 CUBLAS 矩阵操作执行此操作吗？

最佳答案

在您发布的 cublas 文档中，答案是正确的 - cublasgeam() - 如果 C 与 A 或 B 重叠，则行为未定义。如果 C == A，Nvidia 不保证这会起作用。

关于输入矩阵也可以用于存储 CUBLAS 的输出矩阵吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16329997/

相关文章：

c - 在 C 中将字符串从代码存储器存储到 IDATA 存储器 (8051)