c++ - 调试 "Invalid address space"错误

标签 c++ debugging openacc

我构建了一些使用 OpenACC 的 C++ 代码,并使用 PGI 编译器对其进行了编译,以便在 Tesla GPU 上使用。

编译成功,没有任何警告。

我运行程序并得到两个错误:

call to cuStreamSynchronize returned error 717: Invalid address space
call to cuMemFreeHost returned error 717: Invalid address space

除了建议 enabling unified memory 之外,互联网似乎对此知之甚少。这样问题就自动被掩盖了。我不喜欢那种解决方案。

我该如何调试它?

对于仅在 CPU 上运行的 C++ 代码,我会启动 gdb,进行回溯,然后说“啊哈!”

但现在我的代码存在于 CPU GPU 上,数据在两者之间流动。我什至不知道该使用什么工具。

后备方案是开始注释行,直到问题消失,但这似乎也不是最佳选择。

最佳答案

您可以使用“cuda-gdb”调试设备代码或使用“cuda-memcheck”检查内存错误。

虽然我不确定两者是否对这里有帮助。该错误表明设备代码正在使用来自错误内存空间的地址发出指令。例如,将共享内存指针与需要全局内存指针的指令一起使用。

我以前没有见过这个错误,也没有看到任何以前的错误报告,所以只能推测原因。一种可能性是,如果您有一个共享内存变量(“private”子句中的标量或数组,或“缓存”指令)从外部 gang 循环传递到 vector 例程。在这种情况下, vector 例程可能正在访问变量,就好像它在全局内存中一样。

无论是什么原因,很可能是编译器错误。如果可能,请张贴或发送给 PGI 客户服务 (trs@pgroup.com) 一个重现示例,我会把它交给我们的编译器工程师进行调查。

一旦我更好地了解原因,我也可以尝试为您提供解决方法。不过与此同时,您可以尝试使用“-ta=tesla:nollvm,keepgpu”进行编译。 “nollvm”将导致编译器生成 OpenACC 内核的中间 CUDA C 版本,而不是默认的 LLVM 设备代码生成器。 “keepgpu”将保留您可以检查的中间“.gpu”文件。

关于c++ - 调试 "Invalid address space"错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46083799/

相关文章:

c++ - 一种特定类型的可变模板参数

C++ unique_ptr 从派生到基础的转换

jQuery 断言支持/防御性编程?

windows - Windows 进程的转储句柄和有关它们的额外信息

c++ - 如何在GPU上复制OpenACC中分配的 vector 指针内存的 vector

c# - 创建具有完全信任权限(包括网络权限)的托管 CLR AppDomain

c++ - 如何初始化由 unique_ptr 管理的数组的元素?

.net - 在调试器中格式化第 3 方 .NET 对象

c - 使用 openmp 使用 C 通过 openacc 在多个 GPU 上分配矩阵乘法工作

Windows 环境 OpenACC