c++ - 非常适合 Xeon-phi 众核架构的应用程序

从这里https://software.intel.com/en-us/videos/purpose-of-the-mic-architecture我了解具有复杂或大量随机内存访问的应用程序不太适合 Intel Xeon-phi。这是因为该架构使用了 61 个内核和 8 个内存 Controller 。在 L1 和 L2 缓存未命中的情况下，最多需要 100 秒的周期才能将行提取到内存中并准备好供 CPU 使用。此类应用程序称为延迟限制。

然后，教程提到众核架构(仅限 Xeon-phi 协处理器)非常适合高度并行的同构代码。那里有两个问题:

什么叫同构代码？
哪些实际应用可以充分受益于 MIC 架构？

最佳答案

我将英特尔 MIC 架构视为“基于 x86 的 GPGPU”，如果您熟悉 GPGPU 的概念，您会发现自己熟悉英特尔 MIC。

同构集群是一种系统基础架构，具有多个执行单元(即 CPU)，所有这些单元都具有相同的功能。例如，具有四个 Intel Xeon 处理器的多核系统是同构的。

异构集群 是一种系统基础架构，具有多个具有不同功能的执行单元(例如 CPU 和 GPU)。例如，我的 Levono z510 及其 Intel i7 Haswell(4 个 CPU)、Nvidia GT740M(GPU)和 Intel HD Graphics 4600(GPU)是一个异构系统。

异构代码的示例可以是视频游戏。
一个视频游戏有一个控制代码，由一个 CPU 的一个代码执行，控制其他代理做什么，它发送着色器在 GPU 上执行，在其他内核或 GPU 上执行物理计算等等。
在此示例中，您需要编写在 CPU 上运行的代码(因此它是“CPU 感知的”)和在 GPU 上运行的代码(因此它是“GPU 感知的”)。这实际上是通过使用不同的工具、不同的编程语言和不同的编程模型来完成的!

同类代码 是不需要了解n 种不同编程模型的代码，每种模型对应一种不同的代理。只是相同的编程模型、语言和工具。
看一看用于 MPI 库的这个非常简单的 sample code。
代码全部用 C 编写，相同的程序只是采用不同的流程。

关于应用程序，这确实是一个广泛的问题...

如上所述，我将英特尔 MIC 视为基于 x86 ISA(至少部分)的 GPGPU。

一个 SDK 特别有用(并在您链接的视频中列出)与集群系统一起工作是 OpenCL ，它可以用于快速 processing of images and computer vision 并且基本上用于任何需要相同算法运行数十亿次的东西不同的输入(如加密应用程序/暴力破解)。
如果您在 Web 上搜索一些基于 OpenCL 的项目，您会得到一个想法。

要回答您的第二个问题，最好问问我们自己“什么不能利用 MIC 架构？”，我们很快就会发现算法与 Stream Processing 的概念相距越远以及相关主题，包括Kernel中的一个，越不适合MIC。

关于c++ - 非常适合 Xeon-phi 众核架构的应用程序，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31369052/

c++ - 非常适合 Xeon-phi 众核架构的应用程序

上一篇：c++ - Arduino - C++ 对象构造函数错误

下一篇：c++ - boost::asio async_read_some 工作一次然后停止工作，为什么？ (使用 shared_ptr)