c - pyCUDA vs C 性能差异？

我是 CUDA 编程的新手，我想知道 pyCUDA 的性能与用普通 C 实现的程序相比如何。性能会大致相同吗？有没有我应该注意的瓶颈？

编辑: 我显然首先尝试用谷歌搜索这个问题，但很惊讶没有找到任何信息。即我会排除 pyCUDA 人员在他们的常见问题解答中回答了这个问题。

最佳答案

如果您正在使用 CUDA——无论是直接通过 C 还是使用 pyCUDA——您所做的所有繁重的数字工作都是在内核中完成的，这些内核在 gpu 上执行并用 CUDA C 编写(由您直接编写，或者间接与元素内核)。因此，您的代码的这些部分在性能上应该没有真正的差异。

现在，如果您使用 pyCUDA，数组的初始化和任何后期分析都将在 python 中完成(可能使用 numpy)，这通常比直接在编译语言中执行要慢得多(尽管如果您已经以直接链接到高性能库的方式构建了您的 numpy/scipy，那么这些调用至少会在任何一种语言中执行相同的操作)。但希望您的初始化和完成只是您必须完成的总工作量的一小部分，因此即使那里有大量开销，它仍然希望不会对整体运行时间产生巨大影响。

事实上，如果计算的 Python 部分确实会损害应用程序的性能，那么开始在 pyCUDA 中进行开发可能仍然是一个很好的入门方式，因为开发要容易得多，而且您可以始终在直接 C 中重新实现那些在 Python 中速度太慢的代码部分，并从 Python 中调用它们，获得两全其美的一些好处。

关于c - pyCUDA vs C 性能差异？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7931314/

c - pyCUDA vs C 性能差异？

上一篇：c - Valgrind:大小 4 的无效读取 -> sigsegv，在没有 valgrind 和 visual studio 的情况下工作正常

下一篇：c - float_t 有什么意义，什么时候应该使用它？