c++ - 有选择地编译 CUDA 中的头文件和类函数

标签 c++ cuda linker nvcc

我正在尝试在 CUDA 中使用我的 C++ 类。

我有一个这样的类(class):

#include<string>
#include<stdlib.h>

class exampleClass{
int i;
__host__ __device__ exampleClass(int _i):i(_i){};
__host__ __device__ void increment(){i++;}
__host__ __device__ string outputMessage(return itoa(i);}

};

我已将其设置在 .cu 文件中并设置为编译 CUDA c/c++

这无法使用 nvcc 进行编译,因为 cuda 没有字符串。

我想做的是通过执行以下操作来保留仅 CUDA 的功能:

#ifndef __CUDA_ARCH__
  #include<string>
#endif
    #include<stdlib.h>

    class exampleClass{
    int i;
    __host__ __device__ exampleClass(int _i):i(_i){};
    __host__ __device__ void increment(){i++;}
#ifndef __CUDA_ARCH__
     string outputMessage(return itoa(i);}
#endif

    };

但我知道这不起作用......至少,它对我不起作用。 nvcc 不喜欢字符串包含,显然也不喜欢需要字符串类型的函数。

如果这个例子不是一流的,我们深表歉意。总之,我想做的是让核心类成员在 CUDA 上可执行,同时保持在主机端进行分析和输出的精美主机操作的能力。

更新:我的最终目标是拥有一个基类,其中包含指向多个多态类的多个指针类型。这个基类本身是可派生的。我认为这在CUDA5.0中是可能的。我是不是搞错了?

最佳答案

构建了以下代码,尽管我没有运行它:

class exampleClass{
int i;
public:
__host__ __device__ exampleClass(int _i):i(_i){};
__host__ __device__ void increment(){i++;}

 __host__ string outputMessage(){ return "asdf";}


};

__global__ void testkernel (                        
    exampleClass *a,
    int IH, int IW)
{
    const int i = IMUL(blockIdx.x, blockDim.x) + threadIdx.x;
    const int j = IMUL(blockIdx.y, blockDim.y) + threadIdx.y;


    if (i<IW && j<IH) 
    {
        const int i_idx = i + IMUL(j, IW);  
        exampleClass* ptr = a+i_idx;
        ptr->increment();
    }
}

__host__ void test_function(exampleClass *a,
    int IH, int IW)
{
    for (int i = 0; i < IW; i++)
        for (int j = 0; j < IH; j++)
        {
            const int i_idx = i + j*IW;
            exampleClass* ptr = a+i_idx;
            cout << ptr->outputMessage();
        }
}

请注意,您必须将类从设备内存移动到主机内存才能正常“工作”。如果您尝试对类做任何花哨的事情(例如多态性),这可能会失败。

关于c++ - 有选择地编译 CUDA 中的头文件和类函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15690790/

相关文章:

C++ : Seeding mt的低32位包含什么

c++ Mysql C API 连接问题

CUDA atomicAdd() 产生错误的结果

c++ - 无法读取文件并放置在 CUDA 中的二维相对矩阵地址中

c++ - 无法将 Qt 链接到 Xcode

c - 有什么方法可以更改链接以避免 HPUX 上的 LD_PRELOAD?

c++ - 小字符串优化(SSO)和移动语义

c++ - 将 cuda 上下文传递给工作线程

c++ - 在模板类的复制构造函数中使用默认值时出错

c++ - 具有类成员函数返回类型的 enable_if