python - while 循环比 for 循环快 1000 倍以上？

所以关于 for 循环与 while 循环的速度的问题之前已经被问过很多次了。 for 循环应该更快。
但是，当我在 Python 3.5.1 中测试它时，结果如下:

timeit.timeit('for i in range(10000): True', number=10000)
>>> 12.697646026868842
timeit.timeit('while i<10000: True; i+=1',setup='i=0', number=10000)
>>> 0.0032265179766799434

while 循环的运行速度比 for 循环快 >3000 倍!我还尝试为 for 循环预先生成一个列表:

timeit.timeit('for i in lis: True',setup='lis = [x for x in range(10000)]', number=10000)
>>> 3.638794646750142
timeit.timeit('while i<10000: True; i+=1',setup='i=0', number=10000)
>>> 0.0032454974941904524

这使得 for 循环快了 3 倍，但差异仍然是 3 个数量级。

为什么会这样？

最佳答案

您正在创建 10k 个 range() 对象。这些需要一些时间才能实现。然后，您还必须为这 10k 个对象创建 iterator objects(以便 for 循环迭代这些值)。接下来，for 循环通过在生成的迭代器上调用 __next__ method 来使用迭代器协议(protocol)。后两个步骤也适用于列表上的 for 循环。

但最重要的是，您在 while 循环测试中作弊。 while 循环只需运行一次，因为您永远不会将i 重置回0(感谢Jim Fasarakis Hilliard pointing that out) .您实际上是在通过总共 19999 次比较运行 while 循环；第一个测试运行 10k 次比较，其余 9999 次测试运行一次比较。而且这种比较很快:

>>> import timeit
>>> timeit.timeit('while i<10000: True; i+=1',setup='i=0', number=10000)
0.0008302750065922737
>>> (
...     timeit.timeit('while i<10000: True; i+=1', setup='i=0', number=1) +
...     timeit.timeit('10000 < 10000', number=9999)
... )
0.0008467709994874895

看看这些数字有多接近？

我的机器有点快，所以让我们创建一个基准来进行比较；这是在运行 OS X 10.12.5 的 Macbook Pro(Retina，15 英寸，2015 年中)上使用 3.6.1。并且让我们修复 while 循环以在测试中设置 i = 0，而不是设置(仅运行一次):

>>> import timeit
>>> timeit.timeit('for i in range(10000): pass', number=10000)
1.9789885189966299
>>> timeit.timeit('i=0\nwhile i<10000: True; i+=1', number=10000)
5.172155902953818

糟糕，正确运行的 while 实际上在这里慢，这是你的前提(和我的!)。

我使用 pass 来避免回答有关引用该对象有多快的问题(它很快但不是重点)。我的计时将比您的机器快 6 倍。

如果您想探索迭代速度更快的原因，您可以在 Python 中为 for 循环的各个组件计时，从创建 range() 对象开始:

>>> timeit.timeit('range(10000)', number=10000)
0.0036197409499436617

因此创建 10000 个 range() 对象比运行一个迭代 10k 次的 while 循环花费更多的时间。 range() 对象的创建成本高于整数。

这涉及全局名称查找，速度较慢，您可以通过使用 setup='_range = range' 然后使用 _range(1000) 使其更快；这节省了大约 1/3 的时间。

接下来，为此创建一个迭代器；在这里，我将为 iter() function 使用一个本地名称，因为 for 循环不必执行哈希表查找，而只是访问 C 函数。当然，对二进制内存位置的硬编码引用要快得多:

>>> timeit.timeit('_iter(r)', setup='_iter = iter; r = range(10000)', number=10000)
0.0009729859884828329

相当快，但是；它花费的时间与单个 while 循环迭代 10k 次所花费的时间相同。所以创建可迭代对象是很便宜的。 C 实现更快。我们还没有迭代。

最后，我们在迭代器对象上调用 __next__ 10k 次。这也是在 C 代码中完成的，缓存了对内部 C 实现的引用，但是使用 functools.partial() object 我们至少可以尝试得到一个大概的数字:

>>> timeit.timeit('n()', setup='from functools import partial; i = iter(range(10000)); n = partial(i.__next__)', number=10000) * 10000
7.759470026940107

男孩，10k 次 10k 调用 iter(range(1000)).__next__ 花费的时间几乎是 for 循环管理的 4 倍；这表明实际 C 实现的效率是多么高。

但是，它确实说明了 C 代码中的循环要快得多，这就是为什么 while 循环在正确执行时实际上更慢的原因；在字节码中对整数求和并进行 bool 比较比在 C 代码中迭代 range() 花费更多的时间(其中 CPU 直接在 CPU 寄存器中进行递增和比较):

>>> (
...     timeit.timeit('9999 + 1', number=10000 ** 2) +
...     timeit.timeit('9999 < 10000', number=10000 ** 2)
... )    
3.695550534990616

正是这些操作使 while 循环慢了大约 3 秒。

TLDR:您实际上没有正确测试 while 循环。我也应该早点注意到这一点。

关于python - while 循环比 for 循环快 1000 倍以上？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44759869/

python - while 循环比 for 循环快 1000 倍以上？

上一篇：python - Odoo安装 ''错误: [Errno 98] Address already in use''

下一篇：python - 如何以列表/字典的形式读取文件？