c++ - 如何在结构中的指针上使用 cudaMalloc？

我希望在 CUDA5.0 中将内容从主机复制到设备更加方便。所以我想创建一个以主 vector 作为参数并返回如下结构的函数:

template <typename T>
struct devArr
{
    unsigned int size;   //array size
    T *address;          //address on device
};

目的是将数据复制到代码中的任何位置的设备，然后仅将该结构传递给使用该数据的任何设备函数，而不必单独处理数组边界。

返回结构的函数可能如下所示:

template <typename T>
struct cudaArr<T> VectorToDevice(vector<T> arr)
{
    struct devArr<T> darr;
    darr.size = arr.size();
    cudaMalloc((void**)&darr.address, arr.size()*sizeof(T));
    cudaMemcpy(darr.address,&arr[0], arr.size()*sizeof(T), cudaMemcpyHostToDevice);
    return darr;
}

所以这一切都编译得很好。但是使用这段代码，我的结构中的指针没有指向正确的地址。一般来说，这必须是如何处理结构中的指针的问题。那么如何在结构体中正确使用 cudaMalloc 和指针呢？

谢谢。

最佳答案

你就是这样做的。让我感到困惑并需要注意的是，指针包含设备内存上的地址，因此它仅在设备函数中有效。在主机代码中，它指向错误的数据。

关于c++ - 如何在结构中的指针上使用 cudaMalloc？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28115782/

上一篇：c++ - 从命令行定义源文件的宏

下一篇：c++ - 仅当指针作为参数传递给函数时才存在类型别名问题吗？

相关文章：

c++ - 为什么ARM的这条分支指令不起作用

c - 如何在Linux上使用C将内存数据写入DVD？

c - 在C中以小写形式获取文件扩展名

c++ - 如何遍历基类对象的 vector ？

c++ - 使用 Chebyshev 距离探索矩阵

计算长期移动平均线

c - 为什么我们包含 stdlib.h？

c++ - auto_ptr 在没有分配其返回值的情况下被释放

c++ - 是否有可能有一个指针文字？

c++ - 我可以有一个带有可变对象的模板吗？