cuda - block 中的CUDA最大线程

标签 cuda

我对编程指南感到困惑。它指出以下内容:


maxThreadsPerBlock:512
maxThreadsDim:512,512,64。


当一个块中的最大线程数可以为512时,最大线程尺寸如何为512 * 512 * 64?

最佳答案

X方向上的最大线程数:512(计算能力> = 2.0时为1024)

Y方向上的最大线程数:512(计算能力> = 2.0时为1024)

Z方向上的最大线程数:64

因此,您可以启动以下块配置(括号中显示的计算能力> = 2.0)


512 x 1 x 1(1024 x 1 x 1)
128 x 2 x 2(256 x 2 x 2)
1 x 512 x 1(1 x 1024 x 1)
1 x 8 x 64(2 x 8 x 64)
2 x 4 x 64(4 x 4 x 64)


等等。

块中的线程总数不得超过512(对于计算能力<2.0)或1024(对于计算能力> = 2.0)。

关于cuda - block 中的CUDA最大线程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5062781/

相关文章:

opencv - 如何在没有CMake的情况下在opencv v2.4.4和VC10中启用CUDA 5.0并解决错误 'missing cudart32_42_9.dll'?

python - 交换 PyCuda DeviceAllocation 对象是一个坏主意吗?

cuda寄存器压力

cuda - GPU内存带宽理论与实际

cuda - Cuda C++ 的设备代码中没有元组吗?

parallel-processing - 处理 CUDA 中的大型 switch 语句

c++ - 使用cuda进行基数选择

c++ - 调用多个内核,全局内存性能 - CUDA

c# - 从 CUDA 更新 D3D9 纹理

cuda - 在 nvidia gpu 上,__hmul 使用 fp32 核心吗?