python - Python 中的线程——我错过了什么？

这是我在 Python 中对线程的第一次尝试......它惨遭失败 :) 我想实现一个基本的临界区问题，但发现这段代码实际上没有问题。

问题:为什么我的计数器增量没有问题？运行后计数器不应该有随机值吗？如果递增已经自动执行，或者线程不是并发的，我只能解释这一点......

import threading
import time

turnstile_names = ["N", "E", "S", "W"]
count = 0

class Counter(threading.Thread):
    def __init__(self, id):
        threading.Thread.__init__(self)
        self.id = id

    def run(self):
        global count
        for i in range(20):
            #self.sem.acquire()
            count = count + 1
            #self.sem.release()

def main():
    sem = threading.Semaphore(1)

    counters = [Counter(name) for name in turnstile_names]

    for counter in counters:
        counter.start()

    # We're running!

    for counter in counters:
        counter.join()

    print count
    return 0

if __name__ == '__main__':
    main()

注意:我留下了 acquire() 和 release() 调用的注释以检查差异。我试图在增量之后添加小的 sleep 来调整线程的速度 - 没有区别

解决方案/测试:谢谢凯文(请参阅下面接受的答案)。我只是在测试更改循环变量并得到这个:

Loops    Result
20       99% of the time 80. Sometimes 60.
200      99% of the time 800. Sometimes 600.
2000     Maybe 10% of the time different value
20000    Finally... random numbers! I've yet to see 80000 or 60000.
         All numbers are now random, as originally expected.

我怀疑这似乎意味着线程开销大约是 10^4 增量操作。

另一个有趣的测试(好吧，至少在我看来是这样):

我在递增后添加了time.sleep(random.random()/divisor) 发现，循环计数再次为20:

divisor     result
100         always 4, so the race condition is always there.
1000        95% of the time 4, sometimes 3 or 5 (once 7)
10000       99% of the time NOT 4, varying from 4 to 13
100000      basically same as 10000
1000000     varying from 10 to 70
10000000... same as previous... (even with time.sleep(0))

最佳答案

如果增加每个线程的迭代次数:

def run(self):
    global count
    for i in range(100000):
        #self.sem.acquire()
        count = count + 1
        #self.sem.release()

然后确实发生了竞争条件。您的脚本打印例如175165，预计为 400000。这表明递增不是原子的。

递增不是原子的额外证据:CPython 中线程的行为由 Global Interpreter Lock 强制执行.根据维基，

the global interpreter lock, or GIL, is a mutex that prevents multiple native threads from executing Python bytecodes at once.

如果 GIL 具有字节码级别的粒度，那么我们期望增量不是原子的，因为它需要多个字节码来执行，如 dis 模块所示:

>>> import dis
>>> def f():
...     x = 0
...     x = x + 1
...
>>> dis.dis(f)
  2           0 LOAD_CONST               1 (0)
              3 STORE_FAST               0 (x)

  3           6 LOAD_FAST                0 (x)
              9 LOAD_CONST               2 (1)
             12 BINARY_ADD
             13 STORE_FAST               0 (x)
             16 LOAD_CONST               0 (None)
             19 RETURN_VALUE

这里，递增操作由字节码 6 到 13 执行。

那么为什么原始代码没有表现出竞争条件呢？这似乎是由于每个线程的预期生命周期较短 - 通过仅循环 20 次，每个线程将完成其工作并在下一个线程开始其自己的工作之前死亡。

关于python - Python 中的线程——我错过了什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29631258/

python - Python 中的线程——我错过了什么？

上一篇：python - 根据其他两个数组中公共(public)值的索引从数组返回值

下一篇：python - 加速 SymPy 方程求解器