c++ - 将类对象传递给 __global__ 内核

标签 c++ cuda

我想将一个类对象传递给一个全局内核并在其中执行它的成员函数。到目前为止,我所有的努力都没有成功。下面我将详细描述我正在尝试做的事情。

我有类 PDE_Parabolic_Num_GPU 实现如下:

class PDE_Parabolic_Num_GPU: public PDE_Parabolic_GPU
 {
  public:
   __host__ __device__ PDE_Parabolic_Num_GPU();
   __host__ __device__ ~PDE_Parabolic_Num_GPU();
   __host__ __device__ Solve();
   __host__ __device__ Setup();
   ...

  //data
  gdd_real*   an;
  gdd_real*   bn;
  gdd_real*   cn;
}

gdd_real 在哪里

struct gdd_real 
{
    double2 val;
        __host__  __device__ gdd_real(double hi, double lo) {val.x = hi; val.y = lo;}
    __host__  __device__ gdd_real(double h){val.x = h; val.y = 0.;}
    __host__  __device__ gdd_real(){};
};

在我的 main() 中,我正在执行通常的 cudaMalloc 和 cudaMemcpy,以便将我的类对象传递给全局内核:

PDE_Parabolic_Num_GPU pdes_host;
PDE_Parabolic_Num_GPU *pdes_dev;
cudaError_t cudaStatus;
cudaStatus = cudaMalloc((void**)&pdes_dev, 1 * sizeof(PDE_Parabolic_Num_GPU));
cudaStatus = cudaMemcpy(pdes_dev, &pdes_host, sizeof(PDE_Parabolic_Num_GPU), cudaMemcpyHostToDevice);
pdegpu<<<1,1>>>(pdes_dev);
cudaStatus = cudaThreadSynchronize();
cudaStatus = cudaMemcpy(&pdes_host, pdes_dev, sizeof(PDE_Parabolic_Num_GPU), cudaMemcpyDeviceToHost);
cudaStatus = cudaThreadExit();
system("pause");

pdegpu内核如下:

__global__ void pdegpu(PDE_Parabolic_Num_GPU *pdes)
{
  pdes->Setup(); //initializes class members an, bn, cn using "new" 
  pdes->Solve();    
}

我的第一个问题:程序在调试过程中在 pdes->Setup() 处崩溃;

第二个问题是:如果我将内核更改为使用如下所示的本地对象,则在调试期间程序会在 main() 中的 system("pause") 语句后崩溃。

__global__ void pdegpu()
{
      PDE_Parabolic_Num_GPU pdes;  //using local object
      pdes.Setup(); 
      pdes.Solve(); 
}

这是使用Nsight调试时程序崩溃的两种情况。但是当我在没有调试的情况下运行程序时,第二个版本的 pdegpu(使用本地对象)在 pdes.Solve() 处崩溃。 谁能帮我解决这些问题? 谢谢,

最佳答案

为什么要存储指向 gdd_real 的指针?您可以将这种类型的对象直接放在您的类中。这样,您将避免与内存相关的问题。

那么为什么不直接使用:

    //...
    gdd_real   an;
    gdd_real   bn;
    gdd_real   cn;
}

关于c++ - 将类对象传递给 __global__ 内核,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14612063/

相关文章:

c - 如何确定缓冲区是在 GPU 还是 CPU 上?

c++ - _CrtIsValidHeapPointer(block) 加载异常

cuda - GPU设备模拟器

c++ - 如何在 win32 或 MFC 中按名称获取字符串资源?

c++ - void 指针可以指向 lambda 函数吗?

c++ - Qt、QTransform旋转

c - 如何在新的 MacBookPro 上以编程方式激活 nVidia 卡以进行 CUDA 编程?

c++ - 在Poco::Data for SQLite中,是否可以查看生成的sql?

c++ - 在两个派生类之间执行专用代码

c++ - CUDA 错误 : too much shared data (0x4018 bytes, 0x4000 最大值): where do the extra 0x18bytes come from?