cuda - Mathematica 中 NVIDIA K20 GPU 上的内核数

标签 cuda wolfram-mathematica opencl nvidia

我在 Mathematica 中使用 NVIDIA K20 GPU。 K20 的白皮书规定了以下规范:

  • 2496 个单精度内核(每个多处理器 192 个 x 13 个多处理器)
  • 832 个 double 内核(每个多处理器 64 个 x 13 个多处理器)
  • 416 个特殊功能单元(每个多处理器 32 个 x 13 个多处理器)

  • 但是,当我启动 Mathematica 并在加载 OpenCL 或 CUDA 后查看 GPU 的规范时,它说我只有 416 个内核(我附上了 Mathematica 命令的屏幕截图和报告的规范)。这是否与 double 内核或特殊功能单元的数量有关? Mathematica 在我告诉它我将编写什么样的代码之前报告这些规范(例如 double 、超越函数)。 enter image description here

    最佳答案

    很有可能您的 Mathematica 还不知道 Kepler 架构,因此将多处理器数量错误地转换为核心数量。

    由于无论如何“核心”主要是营销发明,因此您可以放心地忽略该数字。 Mathematica 仍将使用整个 GPU(尽管 Kepler-aware 版本可能仍会通过其他优化带来一些加速)。

    关于cuda - Mathematica 中 NVIDIA K20 GPU 上的内核数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15844094/

    相关文章:

    c++ - 计算 3x3 对称矩阵谱分解的快速方法

    cuda - CUDA中偶数和奇数的分离

    c++ - 在cuda中将3D阵列展平为1D

    wolfram-mathematica - 如何在 Mathematica 中有效地设置矩阵的次要?

    math - Mathematica 如何创建 InterpolatingFunction 对象?

    c++ - CUDA 时间事件

    wolfram-mathematica - 在 ListPlot 中指定颜色序列

    cuda - 是否有可用的基于 GPU 的约束求解器? CUDA,OpenCL?

    c++ - CUDA/开放式;将分支重写为非分支表达式

    CPU 运行速度比 GPU 快(OpenCL 代码)