c++ - 非常适合 Xeon-phi 众核架构的应用程序

标签 c++ multithreading intel processor xeon-phi

从这里https://software.intel.com/en-us/videos/purpose-of-the-mic-architecture我了解具有复杂或大量随机内存访问的应用程序不太适合 Intel Xeon-phi。这是因为该架构使用了 61 个内核和 8 个内存 Controller 。在 L1 和 L2 缓存未命中的情况下,最多需要 100 秒的周期才能将行提取到内存中并准备好供 CPU 使用。此类应用程序称为延迟限制。

然后,教程提到众核架构(仅限 Xeon-phi 协处理器)非常适合高度并行的同构代码。那里有两个问题:

  1. 什么叫同构代码?

  2. 哪些实际应用可以充分受益于 MIC 架构?

最佳答案

我将英特尔 MIC 架构视为“基于 x86 的 GPGPU”,如果您熟悉 GPGPU 的概念,您会发现自己熟悉英特尔 MIC。


同构集群是一种系统基础架构,具有多个执行单元(即 CPU),所有这些单元都具有相同的功能。例如,具有四个 Intel Xeon 处理器的多核系统是同构的。

异构集群 是一种系统基础架构,具有多个具有不同功能的执行单元(例如 CPU 和 GPU)。例如,我的 Levono z510 及其 Intel i7 Haswell(4 个 CPU)、Nvidia GT740M(GPU)和 Intel HD Graphics 4600(GPU)是一个异构系统。

异构代码的示例可以是视频游戏。
一个视频游戏有一个控制代码,由一个 CPU 的一个代码执行,控制其他代理做什么,它发送着色器在 GPU 上执行,在其他内核或 GPU 上执行物理计算等等。
在此示例中,您需要编写在 CPU 上运行的代码(因此它是“CPU 感知的”)和在 GPU 上运行的代码(因此它是“GPU 感知的”)。这实际上是通过使用不同的工具不同的编程语言和不同的编程模型来完成的!

同类代码 是不需要了解n 种不同编程模型的代码,每种模型对应一种不同的代理。只是相同的编程模型、语言和工具。
看一看用于 MPI 库的这个非常简单的 sample code
代码全部用 C 编写,相同的程序只是采用不同的流程。


关于应用程序,这确实是一个广泛的问题...

如上所述,我将英特尔 MIC 视为基于 x86 ISA(至少部分)的 GPGPU。

一个 SDK 特别有用(并在您链接的视频中列出)与集群系统一起工作是 OpenCL ,它可以用于快速 processing of images and computer vision 并且基本上用于任何需要相同算法运行数十亿次的东西不同的输入(如加密应用程序/暴力破解)。
如果您在 Web 上搜索一些基于 OpenCL 的项目,您会得到一个想法。

要回答您的第二个问题,最好问问我们自己“什么不能利用 MIC 架构?”,我们很快就会发现算法与 Stream Processing 的概念相距越远以及相关主题,包括Kernel中的一个,越不适合MIC。

关于c++ - 非常适合 Xeon-phi 众核架构的应用程序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31369052/

相关文章:

c++ - Cocos2d-x 子类化问题 CCMenuItemImage

c++ - 使用 SSE 和 STL vector 计算平均值

c++ - CMake:如何仅将特定文件扩展名从一个目录复制到另一个目录

java - 虽然线程中的循环似乎没有运行

c# - SignalAndWait用于锁定上下文

c# - 向现有 WaitAll 添加更多任务

C - 参数名称省略?找不到错误

c++ - Clion Intel C++ 编译器设置

c++ - 应用程序应该如何在 64 位和 32 位英特尔架构中执行?

c++ - 带空括号的默认构造函数