multithreading - 哪个更高效?更多内核或更多 CPU

标签 multithreading performance multicore

我意识到这更像是一个硬件问题,但这也与软件非常相关,尤其是在为多线程多核/cpu 环境编程时。

哪个更好?为什么?无论是关于效率、速度、生产力、可用性等。

1.) 具有 4 个四核 CPU 的计算机/服务器?

或者

2.) 具有 16 个单核 CPU 的计算机/服务器?

请假设所有其他因素(速度、缓存、总线速度、带宽等)都相同。

编辑 :

我一般对性能方面感兴趣。至于它是否在一个方面特别好而在另一个方面很糟糕(或不优选),那么我也想知道这一点。

如果我必须选择,我最感兴趣的是在 I/O 绑定(bind)应用程序和计算绑定(bind)应用程序方面哪个更好。

最佳答案

这不是一个容易回答的问题。毫无疑问,计算机体系结构相当复杂。以下是一些指导方针,但即使这些都是简化。其中很多将归结为您的应用程序以及您在其中工作的限制(业务和技术)。

CPU有几个(一般2-3个)levels of caching on the CPU .一些现代 CPU 在芯片上也有一个内存 Controller 。这可以大大提高内核之间交换内存的速度。 CPU 之间的内存 I/O 必须在外部总线上进行,这往往会更慢。

AMD/ATI 芯片使用HyperTransport ,这是一个点对点协议(protocol)。

然而,使这一切复杂化的是总线架构。 Intel 的 Core 2 Duo/Quad 系统使用 shared bus .把这想象成以太网或有线互联网,只有这么多的带宽可供使用,每个新参与者只是从整体中获得另一份。 Core i7 和更新的 Xeon 使用 QuickPath ,这与 HyperTransport 非常相似。

更多的内核将占用更少的空间,使用更少的空间和更少的功率并且成本更低(除非你使用的是非常低功率的 CPU),无论是在每个内核方面还是在其他硬件(例如主板)的成本方面。

一般来说,一个 CPU 是最便宜的(无论是在硬件还是软件方面)。为此可以使用商品硬件。一旦您使用第二个插槽,您往往不得不使用不同的芯片组、更昂贵的主板和通常更昂贵的 RAM(例如 ECC 全缓冲 RAM),因此您从一个 CPU 变为两个 CPU 会遭受巨大的成本打击。这是许多大型网站(包括 Flickr、Google 和其他网站)使用数千台商品服务器的原因之一(尽管 Google 的服务器在某种程度上是定制的,包括像 9V 电池这样的东西,但原理是一样的)。

您的编辑并没有真正改变太多。 “性能”是一个高度主观的概念。表现在什么方面?请记住,如果您的应用程序没有足够的多线程(或多进程)来利用额外的内核,那么您实际上可以通过添加更多内核来降低性能。

I/O 绑定(bind)应用程序可能不会更喜欢其中一个。毕竟,它们受 I/O 而非 CPU 的约束。

对于基于计算的应用程序,它取决于计算的性质。如果您正在处理大量浮点运算,则可以通过使用 GPU 卸载计算(例如使用 Nvidia CUDA )获得更多好处。你可以得到一个巨大的性能受益于此。看看GPU client for Folding@Home举个例子。

简而言之,您的问题不适合具体答案,因为主题很复杂,而且信息不足。技术架构是必须为特定应用程序设计的东西。

关于multithreading - 哪个更高效?更多内核或更多 CPU,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1081365/

相关文章:

c# - 从其他线程调用主线程中的方法

c# - 我可以在 C# 中的一行上锁定(某物)吗?

php - 循环内的 SQL 查询

linux - 我如何在多核机器上使用脚本查看顶部的所有 cpus

c# - 如何在单元测试 C# 中的多个线程中重复运行 TestMethod

sql - 在 Entity Framework 中,创建投影而不是选择完整实体是否更有效/更受欢迎?

JavaFX TableView 性能问题

c# - 测量进程的单独 cpu 核心使用情况?

haskell - Erlang 的类似于 Threadscope 的处理器查看器/调试器?

c - 使用openmp时运行的线程数不一致