我正在为一个主要用 C++ 和一些 CUDA 编写的大型科学代码设置 Autotools。我找到了一个在 Autotools 中将 CUDA 代码编译和链接到 C 代码的示例,但我无法用 C++ 代码复制该成功。我听说使用 CMake 这会容易得多,但不幸的是,我们致力于使用 Autotools。
在我们旧的手写 Makefile 中,我们简单地使用 make 规则使用 nvcc 将 'cuda_kernels.cu' 编译成 'cuda_kernels.o',并将 cuda_kernels.o 添加到要编译成最终二进制文件的对象列表中.不错,简单,而且有效。
另一方面,Autotools 的基本策略似乎是使用 Libtool 将 .cu 文件编译成“libcudafiles.la”,然后将其余代码链接到该库。然而,这在链接时失败了,一大堆“ undefined reference ......”语句来自链接器。这似乎是 g++ 与 nvcc 编译器(这可以解释为什么它适用于 C 代码)的名称修改问题,但我不确定此时该怎么做。
所有的.cpp和.cu文件都在top/src目录下,所有的编译都是在top/obj目录下完成的。下面是 obj/Makefile.am 的相关细节:
cuda_kernals.cu.o:
$(NVCC) -gencode=arch=compute_20,code=sm_20 -o $@ -c $<
libcudafiles_la_LINK= $(LIBTOOL) --mode=link $(CXX) -o $@ $(CUDA_LDFLAGS) $(CUDA_LIBS)
noinst_LTLIBRARIES = libcudafiles.la
libcudafiles_la_SOURCES = ../src/cuda_kernels.cu
___bin_main_LDADD += libcudafiles.la
___bin_main_LDFLAGS += -static
作为引用,我设法在我们的 GPU 集群上运行的示例可以在 clusterchimps.org 上找到。
感谢任何帮助!
最佳答案
libtool
与 automake
当前生成 foo.lo
(libtool-object 元数据)文件,非 PIC(静态)对象foo.o
,以及 PIC 对象 .libs/foo.o
。
对于一致的 .lo
文件,我会使用如下规则:
.cu.lo:
$(LIBTOOL) --tag=CC --mode=compile $(NVCC) [options...] -c $<
我不知道 nvcc 是否或如何处理 -PIC
标志。更多选项 here .我不知道您从程序中调用了什么,但您是否使用 C 链接向前声明 CUDA 代码?例如,
extern "C"void cudamain (....);
似乎其他人遇到了 libtool 问题。在最坏的情况下,您可能需要一个模仿 .lo
语法和文件位置的“脚本”解决方案,如 clusterchimps 中所述。网站。
关于c++ - 使用 Autotools 构建 CUDA 和 C++,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23116674/