cuda - 推力与 CUDPP

标签 cuda thrust cudpp

为了在带有 CUDA 的 GPU 上使用数据并行算法,有两个标准库,
CUDPP 和 Thrust,实现排序、归约、前缀求和等。

那么,在性能和功能方面,这些库之间的主要区别是什么?

最佳答案

大约一年前,我使用过排序和前缀总和(使用 CUDA 4.1,但我不记得 Thrust 和 CUDPP 的版本)并且我体验到 CUDPP 有点快,但 Thrust 更易于使用(使用 float -array 大约有 20M 个条目)。

至于功能,据我所知,您还可以将 Thrust 与主机内存一起使用,而不仅仅是设备内存(与 CUDPP 相对),但这可能已经过时了。

关于cuda - 推力与 CUDPP,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11563301/

相关文章:

cuda - 使用 CUDA 的标准偏差

c - 堆栈对齐如何工作?

cuda - 对齐图像卷积 (OpenCL/CUDA) 内核的 GPU 内存访问

algorithm - CUDA 流压缩 : understanding the concept

cublasDGemm 奇怪的结果

cuda - 直接在设备上创建一个带有字段的对象

compiler-errors - Cuda 向量类型的推力支持

调用推力后启动的 CUDA 内核是同步还是异步?

cuda - CUDA中的高性能前缀求和/扫描功能,寻找推力,cuDPP库替代