python - 为什么一个简单的 python 生产者/消费者多线程程序不能通过增加 worker 数量来加速？

下面的代码与 http://docs.python.org/2/library/queue.html 处的 python 官方 Queue 示例几乎相同。

from Queue import Queue
from threading import Thread
from time import time
import sys

num_worker_threads = int(sys.argv[1])
source = xrange(10000)

def do_work(item):
    for i in xrange(100000):
        pass

def worker():
    while True:
        item = q.get()
        do_work(item)
        q.task_done()

q = Queue()

for item in source:
    q.put(item)

start = time()

for i in range(num_worker_threads):
    t = Thread(target=worker)
    t.daemon = True
    t.start()

q.join()

end = time()

print(end - start)

这些是 Xeon 12 核处理器上的结果:

$ ./speed.py 1
12.0873839855

$ ./speed.py 2
15.9101941586

$ ./speed.py 4
27.5713479519

我预计增加工作人员的数量会减少响应时间，但实际上它正在增加。我做了一遍又一遍的实验，但结果没有改变。

我是否遗漏了一些明显的东西？或者 python 队列/线程不能正常工作？

最佳答案

是的，关于 GIL，Maxim 是正确的。但是一旦你在 worker 中做了一些值得做的事情，在大多数情况下情况就会改变。在线程中完成的典型事情包括等待 I/O 或其他可以很好地完成线程切换的事情。如果您不只是计算 worker 中的数字，而是模拟在 sleep 中工作，情况会发生巨大变化:

#!/usr/bin/env python

from Queue import Queue
from threading import Thread
from time import time, sleep
import sys

num_worker_threads = int(sys.argv[1])
source = xrange(1000)

def do_work(item):
    for i in xrange(10):
        sleep(0.001)

def worker():
    while True:
        item = q.get()
        do_work(item)
        q.task_done()

q = Queue()

for item in source:
    q.put(item)

start = time()

for i in range(num_worker_threads):
    t = Thread(target=worker)
    t.daemon = True
    t.start()

q.join()

end = time()

结果如下:

for i in 1 2 3 4 5 6 7 8 9 10; do echo -n "$i "; ./t.py $i; done
1 11.0209097862
2 5.50820493698
3 3.65133094788
4 2.73591113091
5 2.19623804092
6 1.83647704124
7 1.57275605202
8 1.38150596619
9 1.23809313774
10 1.1111137867

enter image description here

关于python - 为什么一个简单的 python 生产者/消费者多线程程序不能通过增加 worker 数量来加速？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16665367/

python - 为什么一个简单的 python 生产者/消费者多线程程序不能通过增加 worker 数量来加速？

上一篇：python - 如何使用 any() 函数检查变量是否与列表中的任何项目匹配？

下一篇：python - 如何在 Haskell 中表达这个 Python for 循环？