multithreading - 哪个更高效？更多内核或更多 CPU

我意识到这更像是一个硬件问题，但这也与软件非常相关，尤其是在为多线程多核/cpu 环境编程时。

哪个更好？为什么？无论是关于效率、速度、生产力、可用性等。

1.) 具有 4 个四核 CPU 的计算机/服务器？

或者

2.) 具有 16 个单核 CPU 的计算机/服务器？

请假设所有其他因素(速度、缓存、总线速度、带宽等)都相同。

编辑 :

我一般对性能方面感兴趣。至于它是否在一个方面特别好而在另一个方面很糟糕(或不优选)，那么我也想知道这一点。

如果我必须选择，我最感兴趣的是在 I/O 绑定(bind)应用程序和计算绑定(bind)应用程序方面哪个更好。

最佳答案

这不是一个容易回答的问题。毫无疑问，计算机体系结构相当复杂。以下是一些指导方针，但即使这些都是简化。其中很多将归结为您的应用程序以及您在其中工作的限制(业务和技术)。

CPU有几个(一般2-3个)levels of caching on the CPU .一些现代 CPU 在芯片上也有一个内存 Controller 。这可以大大提高内核之间交换内存的速度。 CPU 之间的内存 I/O 必须在外部总线上进行，这往往会更慢。

AMD/ATI 芯片使用HyperTransport ，这是一个点对点协议(protocol)。

然而，使这一切复杂化的是总线架构。 Intel 的 Core 2 Duo/Quad 系统使用 shared bus .把这想象成以太网或有线互联网，只有这么多的带宽可供使用，每个新参与者只是从整体中获得另一份。 Core i7 和更新的 Xeon 使用 QuickPath ，这与 HyperTransport 非常相似。

更多的内核将占用更少的空间，使用更少的空间和更少的功率并且成本更低(除非你使用的是非常低功率的 CPU)，无论是在每个内核方面还是在其他硬件(例如主板)的成本方面。

一般来说，一个 CPU 是最便宜的(无论是在硬件还是软件方面)。为此可以使用商品硬件。一旦您使用第二个插槽，您往往不得不使用不同的芯片组、更昂贵的主板和通常更昂贵的 RAM(例如 ECC 全缓冲 RAM)，因此您从一个 CPU 变为两个 CPU 会遭受巨大的成本打击。这是许多大型网站(包括 Flickr、Google 和其他网站)使用数千台商品服务器的原因之一(尽管 Google 的服务器在某种程度上是定制的，包括像 9V 电池这样的东西，但原理是一样的)。

您的编辑并没有真正改变太多。 “性能”是一个高度主观的概念。表现在什么方面？请记住，如果您的应用程序没有足够的多线程(或多进程)来利用额外的内核，那么您实际上可以通过添加更多内核来降低性能。

I/O 绑定(bind)应用程序可能不会更喜欢其中一个。毕竟，它们受 I/O 而非 CPU 的约束。

对于基于计算的应用程序，它取决于计算的性质。如果您正在处理大量浮点运算，则可以通过使用 GPU 卸载计算(例如使用 Nvidia CUDA )获得更多好处。你可以得到一个巨大的性能受益于此。看看GPU client for Folding@Home举个例子。

简而言之，您的问题不适合具体答案，因为主题很复杂，而且信息不足。技术架构是必须为特定应用程序设计的东西。

关于multithreading - 哪个更高效？更多内核或更多 CPU，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1081365/

multithreading - 哪个更高效？更多内核或更多 CPU

上一篇：colors - NSProgressIndicator 的 setControlTint 没有效果

下一篇：colors - 选择配色方案