cuda - Mathematica 中 NVIDIA K20 GPU 上的内核数

标签 cuda wolfram-mathematica opencl nvidia

我在 Mathematica 中使用 NVIDIA K20 GPU。 K20 的白皮书规定了以下规范:

2496 个单精度内核(每个多处理器 192 个 x 13 个多处理器)

832 个 double 内核(每个多处理器 64 个 x 13 个多处理器)

416 个特殊功能单元(每个多处理器 32 个 x 13 个多处理器)

但是，当我启动 Mathematica 并在加载 OpenCL 或 CUDA 后查看 GPU 的规范时，它说我只有 416 个内核(我附上了 Mathematica 命令的屏幕截图和报告的规范)。这是否与 double 内核或特殊功能单元的数量有关？ Mathematica 在我告诉它我将编写什么样的代码之前报告这些规范(例如 double 、超越函数)。 enter image description here

最佳答案

很有可能您的 Mathematica 还不知道 Kepler 架构，因此将多处理器数量错误地转换为核心数量。

由于无论如何“核心”主要是营销发明，因此您可以放心地忽略该数字。 Mathematica 仍将使用整个 GPU(尽管 Kepler-aware 版本可能仍会通过其他优化带来一些加速)。

关于cuda - Mathematica 中 NVIDIA K20 GPU 上的内核数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15844094/

上一篇：grails - stacktrace.log 文件太大

下一篇：Facebook 开放图谱 og :image meta tag 的动态图像

相关文章：

c++ - 计算 3x3 对称矩阵谱分解的快速方法

cuda - CUDA中偶数和奇数的分离

c++ - 在cuda中将3D阵列展平为1D

wolfram-mathematica - 如何在 Mathematica 中有效地设置矩阵的次要？

math - Mathematica 如何创建 InterpolatingFunction 对象？

c++ - CUDA 时间事件

wolfram-mathematica - 在 ListPlot 中指定颜色序列

cuda - 是否有可用的基于 GPU 的约束求解器？ CUDA，OpenCL？

c++ - CUDA/开放式；将分支重写为非分支表达式

CPU 运行速度比 GPU 快(OpenCL 代码)