c++ - CUDA内核作为类的成员函数

标签 c++ windows cuda

我正在使用 CUDA 5.0 和 Compute Capability 2.1 卡。

问题很简单:内核可以成为类的一部分吗? 例如:

class Foo
{
private:
 //...
public:
 __global__ void kernel();
};

__global__ void Foo::kernel()
{
 //implementation here
}

如果不是,那么解决方案是创建一个作为类成员的包装函数并在内部调用内核?

如果是,那么它是否可以像普通私有(private)函数一样访问私有(private)属性?

(我不只是尝试看看会发生什么,因为我的项目现在还有其他几个错误,而且我认为这是一个很好的引用问题。我很难找到将 CUDA 与 C++ 结合使用的引用。基本功能可以找到示例,但不能找到结构化代码的策略。)

最佳答案

让我暂时不讨论 cuda 动态并行性(即假设计算能力为 3.0 或更早版本)。

记住 __ global__ 用于将(仅)从主机调用(但在设备上执行)的 cuda 函数。如果您在设备上实例化此对象,它将不起作用。此外,要使成员函数可以使用设备可访问的私有(private)数据,必须在设备上实例化对象。

所以你可以有一个内核调用(即 mykernel<<<blocks,threads>>>(...); 嵌入到宿主对象成员函数中,但内核定义(即带有 __ global__ 装饰器的函数定义)通常先于源代码中的对象定义。如前所述,这种方法不能用于在设备上实例化的对象。它也无法访问对象中其他地方定义的普通私有(private)数据。(可能会出现想出一个只用于主机的对象的方案,它确实创 build 备数据,使用全局内存中的指针,然后可以在设备上访问这些数据,但这样的方案乍一看对我来说似乎很复杂)。

通常,设备可用的成员函数前面会有 __ device__ 装饰器。在这种情况下,设备成员函数中的所有代码都从调用它的线程中执行。

This question给出了一个 C++ 对象的示例(在我编辑的答案中),该对象具有可从主机和设备调用的成员函数,并在主机和设备对象之间进行适当的数据复制。

关于c++ - CUDA内核作为类的成员函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13748231/

相关文章:

c++ - make 如何推断最终目标需要什么样的编译器?

CMake v3.4.1 在 Ubuntu 16.04 上找到 CUDA 7.5 而不是 CUDA 8.0

c++ - Nsight Eclipse 可以分析 C++ 代码吗?

C++,非常意外-1#INF

c++ - 在 vector 中找到最近的点

c++ - 编写一个接受一维数组并计算元素总和并显示它的 C++ 函数

c++ - 如何将 Windows 进程重置为以前的状态?

html - CSS :after background in Safari for Windows

Java 的 g.drawImage 在 Windows 上比 Linux 上花费的时间明显更长

c++ - 重复的可变参数模板参数