我知道我的代码正在 GPU 中运行,因为性能分析器是这么说的,但我得到了关于实际导致它在 GPU 中运行的原因的混合信息。 This著名的微软开发人员说parallel_for是CPU,parallel_for_each是GPU。 This著名的 Microsoft 开发人员暗示 parallel_for 和 parallel_for_each 是可以互换的(在使用方式上略有变化),但甚至没有提及 GPU 或 C++amp,尽管他确实将两者与 OpenMP 进行了比较。 MSDN 也有各方面的文章。是使用哪一个“限制”子句吗?我想我可以做一些实验,但这不是官方说法。如有任何意见,我们将不胜感激。
最佳答案
如果您想确保在 GPU 上运行,请选择要运行代码的 GPU。
std::vector<accelerator> accs = accelerator::get_all();
//std::wcout << "Found " << accs.size() << " C++ AMP accelerator(s):" << std::endl;
//std::for_each(accs.cbegin(), accs.cend(), [](const accelerator& a)
//{
// if (a.get_is_emulated() == false)
// {
// std::wcout << " " << a.device_path << std::endl
// << " description " << a.description
// << " device_path " << a.device_path
// << " is_emulated " << a.get_is_emulated()
// << std::endl << std::endl;
// }
//});
但更具体地说,限制关键字将尝试在加速器上运行(如果可用)。如果不是相同的代码将自己在CPU上运行。在我们的一些项目中,我们检测具有最多内存的加速器(GPU),并将其设为“选择的”加速器。
希望这有帮助。
关于c++ - 是什么导致代码在 GPU 中运行?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43679131/