python - 为什么startswith比slicing慢

为什么要执行startwith比切片还慢？

In [1]: x = 'foobar'

In [2]: y = 'foo'

In [3]: %timeit x.startswith(y)
1000000 loops, best of 3: 321 ns per loop

In [4]: %timeit x[:3] == y
10000000 loops, best of 3: 164 ns per loop

令人惊讶的是，即使包括长度的计算，切片仍然显得更快:

In [5]: %timeit x[:len(y)] == y
1000000 loops, best of 3: 251 ns per loop

注意:此行为的第一部分在 Python for Data Analysis 中注明。 (第 3 章)，但没有提供任何解释。

如果有帮助:here is the C code for startswith ;这是dis.dis的输出:

In [6]: import dis

In [7]: dis_it = lambda x: dis.dis(compile(x, '<none>', 'eval'))

In [8]: dis_it('x[:3]==y')
  1           0 LOAD_NAME                0 (x)
              3 LOAD_CONST               0 (3)
              6 SLICE+2             
              7 LOAD_NAME                1 (y)
             10 COMPARE_OP               2 (==)
             13 RETURN_VALUE        

In [9]: dis_it('x.startswith(y)')
  1           0 LOAD_NAME                0 (x)
              3 LOAD_ATTR                1 (startswith)
              6 LOAD_NAME                2 (y)
              9 CALL_FUNCTION            1
             12 RETURN_VALUE

最佳答案

一些性能差异可以通过考虑 . 操作符执行其操作所花费的时间来解释:

>>> x = 'foobar'
>>> y = 'foo'
>>> sw = x.startswith
>>> %timeit x.startswith(y)
1000000 loops, best of 3: 316 ns per loop
>>> %timeit sw(y)
1000000 loops, best of 3: 267 ns per loop
>>> %timeit x[:3] == y
10000000 loops, best of 3: 151 ns per loop

另一部分差异可以通过 startswith 是一个函数这一事实来解释，即使是无操作函数调用也需要一些时间:

>>> def f():
...     pass
... 
>>> %timeit f()
10000000 loops, best of 3: 105 ns per loop

这并没有完全解释差异，因为使用切片和 len 的版本调用了一个函数并且仍然更快(与 sw(y) 上面 -- 267 ns):

>>> %timeit x[:len(y)] == y
1000000 loops, best of 3: 213 ns per loop

我在这里唯一的猜测是，也许 Python 优化了内置函数的查找时间，或者 len 调用被高度优化(这可能是真的)。可以使用自定义的 len 函数对其进行测试。或者可能这就是 LastCoder 所识别的差异所在。开始。另请注意larsmans ' 结果，这表明 startswith 对于较长的字符串实际上更快。上面的全部推理仅适用于我所说的开销实际上很重要的那些情况。

关于python - 为什么startswith比slicing慢，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13270888/

python - 为什么startswith比slicing慢

上一篇：python - Pandas :删除连续重复

下一篇：Python 格式抛出 KeyError