我对编程指南感到困惑。它指出以下内容:
maxThreadsPerBlock:512
maxThreadsDim:512,512,64。
当一个块中的最大线程数可以为512时,最大线程尺寸如何为512 * 512 * 64?
最佳答案
X方向上的最大线程数:512(计算能力> = 2.0时为1024)
Y方向上的最大线程数:512(计算能力> = 2.0时为1024)
Z方向上的最大线程数:64
因此,您可以启动以下块配置(括号中显示的计算能力> = 2.0)
512 x 1 x 1(1024 x 1 x 1)
128 x 2 x 2(256 x 2 x 2)
1 x 512 x 1(1 x 1024 x 1)
1 x 8 x 64(2 x 8 x 64)
2 x 4 x 64(4 x 4 x 64)
等等。
块中的线程总数不得超过512(对于计算能力<2.0)或1024(对于计算能力> = 2.0)。
关于cuda - block 中的CUDA最大线程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5062781/