c++ - pow 在 CUDA 的 __device__ 函数中无法正常工作

标签 c++ cuda pow

我正在尝试使用函数 pow__device__ 内使用 Visual Studio 2019 在 CUDA 中运行。

__device__ double Len(double a, double b)
{
    return pow(a, 2) + pow(b, 2);
}

但是,当我尝试构建解决方案时,它一直给我这个错误。

Error Undefined reference to '_Z3powdi' in 'x64/Debug/kernel.cu.obj'

仅当我更改 2 时才有效至2.0 .我认为这可能是使用非整数值作为其参数的函数的正确格式,但是当我在普通 C++ 代码中尝试它时,它可以正常使用整数 2 .

这个问题的原因是什么?我该如何解决?

注意事项:

  1. 前几天可以正常使用,这个错误可能是在Visual Studio 2019 16.8.0最新更新后出现的。
  2. 我尝试添加 #include <math.h>并删除它,但它给出了同样的错误。

最佳答案

CUDA 已在设备代码中支持 pow (double, int),因为在 2008 年左右添加了适当的 double 支持。这是至少从 C++98 标准(ISO/IEC 14882 第 26.5 节)。下面是一个完整的包含 OP 功能的示例程序,为简洁起见省略了错误检查:

#include <stdio.h>
#include <stdlib.h>
#include <math.h>

__device__ double Len(double a, double b)
{
    return pow(a, 2) + pow(b, 2);
}

__global__ void kernel (double a, double b)
{
    printf ("len = %23.16e\n", Len(a, b));
}

int main (void)
{
    kernel<<<1,1>>>(3,4);
    cudaDeviceSynchronize();
    return EXIT_SUCCESS;
}

这编译没有错误

  • CUDA 9.2 和 MSVS 2010(Microsoft (R) C/C++ Optimizing Compiler Version 16.00.40219.01 for x64)在 Windows 7 上

  • CUDA 11.1 和 MSVS 2019(Microsoft (R) C/C++ Optimizing Compiler Version 19.27.29112 for x64)在 Windows 10 上

我为发布和调试构建编译如下(大括号中的参数用于调试构建):

nvcc -o pow_dbl_int.exe {-g -G} pow_dbl_int.cu

运行时的可执行文件会产生以下输出:

len =  2.5000000000000000e+01

如果这个示例程序没有像所示的那样使用命令行正确编译,我会怀疑 MSVS 安装或 CUDA 安装有问题。在我的实践中,我发现先安装 MSVS 然后再安装 CUDA 通常是有益的,因此安装后 CUDA 可以正确集成到 MSVS 中。

由于 OP 显然安装了几天前在 November 10, 2020 上发布的 MSVS 版本,主机编译器头文件和 CUDA 头文件之间也有可能不兼容,这就是 CUDA 历来对支持的主机编译器版本进行严格检查的原因(不确定现在是否这样做)。我注意到微软已经发布了 MSVS 2019 16.8.1,发布日期为 2020 年 11 月 12 日。

正如多条评论和 CUDA Best Practices Guide 中所述, 平方更容易通过乘法来完成,不需要调用 pow()

关于c++ - pow 在 CUDA 的 __device__ 函数中无法正常工作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64797767/

相关文章:

c - 在 C 编程语言中使用 pow() 函数时的警告消息

ubuntu - 为什么在 WSL 中使用 RAPIDS 时出现 CUDA 内存错误?

c++ - 将树展平为链表c++,没有指针

java - Java Biginteger 在 pow 中的最大值

c++ - 我可以使用别名模板专门化一个类模板吗?

cuda - 如何释放 device_vector<int>

c++ - pow 函数如何工作?

c++ - 在 C++ 中使用引用进行向上转换

c++ - 具有取消处理的 async_wait 处理程序类成员

c++ - WinAPI:获取键入的字符