假设一个 CUDA GPU 可以在一个多处理器上同时有 48 个事件扭曲,即一个扭曲的 48 个 block ,或者 2 个扭曲的 24 个 block ,...,因为来自多个 block 的所有事件扭曲都被安排执行,看起来大小块的大小对于GPU的占用并不重要(当然应该是32的倍数),32、64、128都没有区别吧?那么 block 的大小只是由计算任务和资源限制(共享内存或寄存器)决定的吗?
最佳答案
您忽略了多个值得考虑的因素。
关于multithreading - CUDA:关于事件扭曲(事件 block )以及如何选择 block 大小的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5378598/