我首先在cublas中处理一个矩阵,我已经将它发送到设备并且我想要处理 矩阵的一些列向量,仍然使用cublas函数。我首先尝试使用指针算术运算来偏移主机的设备指针,但似乎不起作用。 有什么方法可以处理矩阵中的向量而不将其复制回主机。
例如: cublasSscal (int n, float alpha, float *x, int incx); 用于缩放向量 我有一个设备指针指向列主矩阵 B, 我想缩放 B 的第三列而不将向量复制回主机,该怎么做?
最佳答案
m 是行数, ldB 是 B 的主维。
cublasSscal (m, alpha, B + 2*ldB, 1); // indices are 0 based
关于pointers - cuda在主机代码中偏移设备指针,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3507201/