c++ - 使用 Autotools 构建 CUDA 和 C++

标签 c++ cuda autotools

我正在为一个主要用 C++ 和一些 CUDA 编写的大型科学代码设置 Autotools。我找到了一个在 Autotools 中将 CUDA 代码编译和链接到 C 代码的示例,但我无法用 C++ 代码复制该成功。我听说使用 CMake 这会容易得多,但不幸的是,我们致力于使用 Autotools。

在我们旧的手写 Makefile 中,我们简单地使用 make 规则使用 nvcc 将 'cuda_kernels.cu' 编译成 'cuda_kernels.o',并将 cuda_kernels.o 添加到要编译成最终二进制文件的对象列表中.不错,简单,而且有效。

另一方面,Autotools 的基本策略似乎是使用 Libtool 将 .cu 文件编译成“libcudafiles.la”,然后将其余代码链接到该库。然而,这在链接时失败了,一大堆“ undefined reference ......”语句来自链接器。这似乎是 g++ 与 nvcc 编译器(这可以解释为什么它适用于 C 代码)的名称修改问题,但我不确定此时该怎么做。

所有的.cpp和.cu文件都在top/src目录下,所有的编译都是在top/obj目录下完成的。下面是 obj/Makefile.am 的相关细节:

cuda_kernals.cu.o:
    $(NVCC) -gencode=arch=compute_20,code=sm_20 -o $@ -c $<

libcudafiles_la_LINK= $(LIBTOOL) --mode=link $(CXX) -o $@ $(CUDA_LDFLAGS) $(CUDA_LIBS)

noinst_LTLIBRARIES = libcudafiles.la
libcudafiles_la_SOURCES = ../src/cuda_kernels.cu

___bin_main_LDADD += libcudafiles.la
___bin_main_LDFLAGS += -static

作为引用,我设法在我们的 GPU 集群上运行的示例可以在 clusterchimps.org 上找到。

感谢任何帮助!

最佳答案

libtoolautomake 当前生成 foo.lo(libtool-object 元数据)文件,非 PIC(静态)对象foo.o,以及 PIC 对象 .libs/foo.o

对于一致的 .lo 文件,我会使用如下规则:

.cu.lo:
        $(LIBTOOL) --tag=CC --mode=compile $(NVCC) [options...] -c $<

我不知道 nvcc 是否或如何处理 -PIC 标志。更多选项 here .我不知道您从程序中调用了什么,但您是否使用 C 链接向前声明 CUDA 代码?例如,

extern "C"void cudamain (....);

似乎其他人遇到了 libtool 问题。在最坏的情况下,您可能需要一个模仿 .lo 语法和文件位置的“脚本”解决方案,如 clusterchimps 中所述。网站。

关于c++ - 使用 Autotools 构建 CUDA 和 C++,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23116674/

相关文章:

c++ - 如何理解 constexpr 函数具有 "everything it needs"以在编译时计算其结果?

c++ - 使用 std::unique 时如何防止悬空指针?

c++ - Python 嵌入 C++

c++ - 如何安装和使用 libtool 共享库(.lo 文件)?

autotools - 如何配置 autotools/gcc 以使用绝对路径打印警告和错误?

c++ - 如何读取多行输入?

c++ - 升压::变体; std::unique_ptr 和复制

cuda - CUDA内核调用出现"invalid configuration argument "错误?

matlab - CPU 和 GPU 中的 SVD 速度

visual-studio - 配置 CMake 以在 Windows 上设置 CUDA