c++ - opencl 程序没有给出正确的输出

标签 c++ opencl

以下 C++ 和 OpenCL 给出的“结果”为 3 而不是预期的 9 (3+6),我不知道为什么。我的意图只是通过使用数组索引并在两个不同的数组索引处添加数字以给出“结果”来测试访问。鉴于我是 C、C++ 和 OpenCL 的新手,它很可能是基础知识。另外,我使用 vector 作为输入是有原因的——这是我需要在更大范围内做的事情的试运行。非常感谢。

C++:

    vector<long> v1;
    vector<long> v2;
    long result;

    v1.push_back(3);
    v1.push_back(4);

    v2.push_back(5);
    v2.push_back(6);

    long* a1 = &v1[0];
    long* a2 = &v2[0];

    cl::Buffer bufA(context, CL_MEM_READ_ONLY | CL_MEM_USE_HOST_PTR, v1.size()*sizeof(long), a1);
    cl::Buffer bufB(context, CL_MEM_READ_ONLY | CL_MEM_USE_HOST_PTR, v2.size()*sizeof(long), a2);
    cl::Buffer bufC(context, CL_MEM_READ_WRITE, sizeof(long));

    addKernel.setArg(0, bufA);
    addKernel.setArg(1, bufB);
    addKernel.setArg(2, bufC);

    cl::CommandQueue queue(context, devices[0]);

    queue.enqueueTask(addKernel);

    queue.enqueueReadBuffer(bufC, CL_TRUE, 0, sizeof(long), &result);
    queue.flush();
    queue.finish();

    cout << "Result: " << result << endl;

OpenCL:

__kernel void useHostPtr(__global long *a, __global long *b, __global long *c) {
    *c = a[0] + b[1];
}

最佳答案

主机端的long 类型可能有不同的长度。它通常是 4 个字节。在 OpenCL 中,long 被定义为 64 位整数。 您应该在主机代码中使用 cl_long 而不是 long

关于c++ - opencl 程序没有给出正确的输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12427828/

相关文章:

c++ - CvVideoCamera processImage 不会改变图像

C++/SFML 窗口创建失败

c++ - 使用 std::map<K,V> 其中 V 没有可用的默认构造函数

c++ - 在 C 中使用数组

performance - 编译警告 OpenCL 矩阵乘法

c++ - OpenCL AES 并行化

python - 将向量 (float4) kernell 参数传递给 OpenCL (Python)

javascript - 使用 Emscripten 将结构转换为另一个结构的 std::vector

scala - OpenCL 适合基于代理的模拟吗?

python - 是否存在任何用于在Python中使用OpenCL加速对内核进行大于5的中值滤波的库?