cuda – Mathematica中NVIDIA K20 GPU的内核数量

我在Mathematica中使用NVIDIA K20 GPU. K20的白皮书规定了以下规格:

> 2496个单精度内核(每个多处理器192个,13个多处理器)
> 832个双精度内核(每个多处理器64个x 13个多处理器)
> 416个特殊功能单元(每个多处理器32个,13个多处理器)

但是,当我启动Mathematica并在加载OpenCL或CUDA后查看GPU的规格时,它说我只有416个核心(我附上了Mathematica命令和报告规格的屏幕截图).这是否与双精度核心或特殊功能单元的数量有关? Mathematica在我告诉它将编写什么样的代码(例如双精度,超越函数)之前报告这些规范.

最佳答案
您的Mathematica更可能尚未了解Kepler架构,因此将多处理器计数错误地转换为核心计数.

由于“核心”无论如何都是一种营销发明,你可以放心地忽略这个数字. Mathematica仍将使用整个GPU(虽然Kepler感知版本可能仍会通过其他优化带来一些加速).

转载注明原文:cuda – Mathematica中NVIDIA K20 GPU的内核数量 - 代码日志