c++ - 段错误 C++ Cuda

我是一名 Java 程序员，刚接触 C++ 和 Cuda。我在执行以下操作时遇到段错误:

输入.h 类输入 {

public:
    const LucyDecimal * sellingPrice; //Ri
    const LucyDecimal qc;

public:
    Input(
            const LucyDecimal * _sellingPrice, 
            const LucyDecimal _qc);

    virtual ~Input();

};

输入.cpp

Input::Input(
        const LucyDecimal * _sellingPrice, //Ri
        const LucyDecimal _qc):sellingPrice(_sellingPrice),qc(_qc)
{};

Input::~Input() {
}

现在在我的 CudaRun.cu

void mainRun(Input in) {
    Input *deviceIn;
    deviceIn = new Input(NULL, NULL, NULL, NULL, 0.0, NULL,0.0,0.0,NULL,0.0,NULL,0.0);
    //line-a

    printf("Started. Just abt to call cuda \n");
    int size = sizeof(Input);
    cudaMalloc((void**) &deviceIn, size);
    cudaMemcpy(deviceIn, &in, size, cudaMemcpyHostToDevice);

    cudaMalloc((void**) deviceIn->sellingPrice, 4 * sizeof(LucyDecimal));
    //line-b
        ....
}

我在 line-b 处遇到段错误。它与 line-a 初始化有关吗？

最佳答案

您不必创建指向设备内存的指针:

cudaMalloc((void**) &deviceIn, size);

然后在主机代码中取消引用该指针:

cudaMalloc((void**) deviceIn->sellingPrice, 4 * sizeof(LucyDecimal));

要在 deviceIn 结构中实际设置 sellingPrice 指针的值，编译器必须取消引用从基指针计算的指针 (deviceIn) 以便写入分配的指针值，并且这种取消引用在主机代码中是非法的。

复制包含指针的结构称为“深复制”，这有点乏味。

相反，您需要分配一个单独的指针:

LucyDecimal * sellingPrice_temp;
cudaMalloc((void**) &sellingPrice_temp, 4 * sizeof(LucyDecimal));

然后在适当的位置将分配的指针从主机复制到设备:

cudaMemcpy(&(deviceIn->sellingPrice), &sellingPrice_temp, sizeof(LucyDecimal *), cudaMemcpyHostToDevice);

请注意，找到结构中特定位置的地址 (&(deviceIn->sellingPrice)) 是编译器可以计算的内容，无需取消引用基指针 (deviceIn)。

如果您想在某个时候将数据从该嵌入式指针区域复制回主机，您将需要再次使用 sellingPrice_temp。

这个话题出现的频率很高，如果你搜索，你可以找到很多其他的例子。 “CUDA 复制结构嵌入指针”。该方法类似于将双下标 (**) 动态分配的矩阵从主机复制到设备。

我还推荐 proper cuda error checking尽管在这种情况下它不会很有指导意义。

关于c++ - 段错误 C++ Cuda，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/22782897/

c++ - 段错误 C++ Cuda

上一篇：c++ - 如何从头文件中初始化私有(private)数组C++

下一篇：c++ - 创建多个监听套接字