我正在开发一个涉及在 Python 中创建 CUDA 内核的项目。 Numba 工作得很好(这些人所取得的成就非常令人难以置信),PyCUDA 也是如此。
我的问题是我想从 Python 生成的内核中调用 C 设备函数。我找不到办法来完成这个任务。 Numba 可以调用 CFFI 模块,但只能在 CPU 代码中调用。在 PyCUDA 中,我可以将 C 设备函数添加到 SourceModule,但我不知道如何包含另一个库中已存在的函数。
有办法实现这一点吗?
最佳答案
据我所知,这在任何一种语言中都是不可能的。两者都没有公开用于单独编译或 API 的必要工具链控制来执行设备代码的运行时链接。
关于python - 从 Python 内核调用 C++ CUDA 设备函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39555235/