python - while 循环比 for 循环快 1000 倍以上?

标签 python performance python-3.x loops

所以关于 for 循环与 while 循环的速度的问题之前已经被问过很多次了。 for 循环应该更快。
但是,当我在 Python 3.5.1 中测试它时,结果如下:

timeit.timeit('for i in range(10000): True', number=10000)
>>> 12.697646026868842
timeit.timeit('while i<10000: True; i+=1',setup='i=0', number=10000)
>>> 0.0032265179766799434

while 循环的运行速度比 for 循环快 >3000 倍!我还尝试为 for 循环预先生成一个列表:

timeit.timeit('for i in lis: True',setup='lis = [x for x in range(10000)]', number=10000)
>>> 3.638794646750142
timeit.timeit('while i<10000: True; i+=1',setup='i=0', number=10000)
>>> 0.0032454974941904524

这使得 for 循环快了 3 倍,但差异仍然是 3 个数量级。

为什么会这样?

最佳答案

您正在创建 10k 个 range() 对象。这些需要一些时间才能实现。然后,您还必须为这 10k 个对象创建 iterator objects(以便 for 循环迭代这些值)。接下来,for 循环通过在生成的迭代器上调用 __next__ method 来使用迭代器协议(protocol)。后两个步骤也适用于列表上的 for 循环。

但最重要的是,您在 while 循环测试中作弊while 循环只需运行一次,因为您永远不会将i 重置回0(感谢Jim Fasarakis Hilliard pointing that out) .您实际上是在通过总共 19999 次比较运行 while 循环;第一个测试运行 10k 次比较,其余 9999 次测试运行一次比较。而且这种比较很快:

>>> import timeit
>>> timeit.timeit('while i<10000: True; i+=1',setup='i=0', number=10000)
0.0008302750065922737
>>> (
...     timeit.timeit('while i<10000: True; i+=1', setup='i=0', number=1) +
...     timeit.timeit('10000 < 10000', number=9999)
... )
0.0008467709994874895

看看这些数字有多接近?

我的机器有点快,所以让我们创建一个基准来进行比较;这是在运行 OS X 10.12.5 的 Macbook Pro(Retina,15 英寸,2015 年中)上使用 3.6.1。并且让我们修复 while 循环以在测试中设置 i = 0,而不是设置(仅运行一次):

>>> import timeit
>>> timeit.timeit('for i in range(10000): pass', number=10000)
1.9789885189966299
>>> timeit.timeit('i=0\nwhile i<10000: True; i+=1', number=10000)
5.172155902953818

糟糕,正确运行的 while 实际上在这里,这是你的前提(和我的!)。

我使用 pass 来避免回答有关引用该对象有多快的问题(它很快但不是重点)。我的计时将比您的机器快 6 倍。

如果您想探索迭代速度更快的原因,您可以在 Python 中为 for 循环的各个组件计时,从创建 range() 对象开始:

>>> timeit.timeit('range(10000)', number=10000)
0.0036197409499436617

因此创建 10000 个 range() 对象比运行一个迭代 10k 次的 while 循环花费更多的时间。 range() 对象的创建成本高于整数。

这涉及全局名称查找,速度较慢,您可以通过使用 setup='_range = range' 然后使用 _range(1000) 使其更快;这节省了大约 1/3 的时间。

接下来,为此创建一个迭代器;在这里,我将为 iter() function 使用一个本地名称,因为 for 循环不必执行哈希表查找,而只是访问 C 函数。当然,对二进制内存位置的硬编码引用要快得多:

>>> timeit.timeit('_iter(r)', setup='_iter = iter; r = range(10000)', number=10000)
0.0009729859884828329

相当快,但是;它花费的时间与单个 while 循环迭代 10k 次所花费的时间相同。所以创建可迭代对象是很便宜的。 C 实现更快。我们还没有迭代。

最后,我们在迭代器对象上调用 __next__ 10k 次。这也是在 C 代码中完成的,缓存了对内部 C 实现的引用,但是使用 functools.partial() object 我们至少可以尝试得到一个大概的数字:

>>> timeit.timeit('n()', setup='from functools import partial; i = iter(range(10000)); n = partial(i.__next__)', number=10000) * 10000
7.759470026940107

男孩,10k 次 10k 调用 iter(range(1000)).__next__ 花费的时间几乎是 for 循环管理的 4 倍;这表明实际 C 实现的效率是多么高。

但是,它确实说明了 C 代码中的循环要快得多,这就是为什么 while 循环在正确执行时实际上更慢的原因;在字节码中对整数求和并进行 bool 比较比在 C 代码中迭代 range() 花费更多的时间(其中 CPU 直接在 CPU 寄存器中进行递增和比较):

>>> (
...     timeit.timeit('9999 + 1', number=10000 ** 2) +
...     timeit.timeit('9999 < 10000', number=10000 ** 2)
... )    
3.695550534990616

正是这些操作使 while 循环慢了大约 3 秒。


TLDR:您实际上没有正确测试 while 循环。我也应该早点注意到这一点。

关于python - while 循环比 for 循环快 1000 倍以上?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44759869/

相关文章:

python - 如何在正则表达式python中获取重叠字符串

python - 将 numpy 数组(行形式)转换为图像

python - 如何通过Python API获取OpenStack中VM实例的运行时间?

java - 应该使用 TreeMap 还是 HashMap 来包装命名参数?

mysql - Python 3.4 的 MySql 模块可以与 3.5 一起使用吗?

python - 在 Python 中下载带有 "urllib.request.urlretrieve"的图像失败

python - 如何对拟合参数施加约束?

javascript - 为什么在 Chrome 57 中内联 Javascript 比控制台中慢 10 倍以上?

performance - 懒惰列表的 Haskell 性能不佳

python - 基于按组 ID 索引的组中最大 3 个元素的新列