c++ - 是什么导致代码在 GPU 中运行？

我知道我的代码正在 GPU 中运行，因为性能分析器是这么说的，但我得到了关于实际导致它在 GPU 中运行的原因的混合信息。 This著名的微软开发人员说parallel_for是CPU，parallel_for_each是GPU。 This著名的 Microsoft 开发人员暗示 parallel_for 和 parallel_for_each 是可以互换的(在使用方式上略有变化)，但甚至没有提及 GPU 或 C++amp，尽管他确实将两者与 OpenMP 进行了比较。 MSDN 也有各方面的文章。是使用哪一个“限制”子句吗？我想我可以做一些实验，但这不是官方说法。如有任何意见，我们将不胜感激。

最佳答案

如果您想确保在 GPU 上运行，请选择要运行代码的 GPU。

std::vector<accelerator> accs = accelerator::get_all();


//std::wcout << "Found " << accs.size() << " C++ AMP accelerator(s):" << std::endl;
//std::for_each(accs.cbegin(), accs.cend(), [](const accelerator& a)
//{
//  if (a.get_is_emulated() == false)
//  {
//      std::wcout << "  " << a.device_path << std::endl
//          << " description   " << a.description
//          << " device_path   " << a.device_path
//          << " is_emulated   " << a.get_is_emulated()
//          << std::endl << std::endl;
//  }
//});

但更具体地说，限制关键字将尝试在加速器上运行(如果可用)。如果不是相同的代码将自己在CPU上运行。在我们的一些项目中，我们检测具有最多内存的加速器(GPU)，并将其设为“选择的”加速器。

希望这有帮助。

关于c++ - 是什么导致代码在 GPU 中运行？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43679131/

c++ - 是什么导致代码在 GPU 中运行？

上一篇：c++ - 如何避免调用 vector 中元素的复制构造函数

下一篇：c++ - 构建行为排序函数