为了在带有 CUDA 的 GPU 上使用数据并行算法,有两个标准库,
CUDPP 和 Thrust,实现排序、归约、前缀求和等。
那么,在性能和功能方面,这些库之间的主要区别是什么?
最佳答案
大约一年前,我使用过排序和前缀总和(使用 CUDA 4.1,但我不记得 Thrust 和 CUDPP 的版本)并且我体验到 CUDPP 有点快,但 Thrust 更易于使用(使用 float -array 大约有 20M 个条目)。
至于功能,据我所知,您还可以将 Thrust 与主机内存一起使用,而不仅仅是设备内存(与 CUDPP 相对),但这可能已经过时了。
关于cuda - 推力与 CUDPP,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11563301/