<分区>
这个问题真的很笼统,所以这里有更详细的信息: 我目前运行 Ubuntu 14.04,目前在神经网络上工作。为了找到最佳参数,我想训练许多不同的参数化网络,看看哪一个效果最好。
网络及其训练序列是用 c 语言编写的,我有一个 4 核处理器。如果我运行该程序,它会一个接一个地训练每个网络。
现在系统监视器告诉我程序使用了大约 25% 的总处理能力。我怎样才能改进它,平均使用所有内核并 100% 使用我的 cpu(和 gpu?)的最佳方法是什么
目前我正在使用编译标志-pthread
,但我想还有更多的可能性。