我使用了“njobs”参数来获取多样本结果,与我的预期相距甚远
我更改了“.theanorc”文件以设置“floatX”、“cnmem”值等。
我通过命令“nvidia-smi”监控了GPU源,并且很好用
但是,采样速度已经很慢了,甚至比CPU还慢。
这正常吗?
最佳答案
- 这听起来像是收敛或模型构建的问题,与 njobs 或并行性无关。如果没有模型或痕迹,这里就没什么可说的了。
GPU 仍处于实验阶段,我们已经看到某些模型的加速和其他模型的减速。不过,ADVI 似乎更容易在 GPU 上运行。您还可以检查所有模型类型和输入数据是否都是 float32。
关于gpgpu - 如何使用GPU加速Pymc3采样?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41824310/