python - 为什么在 `reversed` 字符串中搜索更大的字符串比切片反转花费更多的时间?

标签 python performance reverse

当我阅读 here 时,使用 reversed 函数反转字符串比切片表示法 string[::-1] 更有效。但是当我自己尝试时,我观察到了不同的结果。
首先,我试图制作一个非常大的字符串。然后我尝试检查检查大字符串中是否存在字符串需要多长时间。这就是我所做的:

In [1]: large = "abcdefgijklmnopqrstuvwxyz1234567890!@#$%^&*()_=+0}{QWERT"                                                                           

In [2]: large = 1000*large                                                                                                                           

In [3]: large = 1000*large  

In [5]: len(large)                                                                                                                                   
Out[5]: 56000000

In [6]: %time "a" in large[::-1]                                                                                                                     
CPU times: user 63 ms, sys: 43.4 ms, total: 106 ms
Wall time: 106 ms
Out[6]: True

In [7]: %time "a" in reversed(large)                                                                                                                 
CPU times: user 11 µs, sys: 1 µs, total: 12 µs
Wall time: 17.6 µs
Out[7]: True

如果我检查 large 中是否只有 1 个字符,reversed 会快得多,但是当我尝试使用更大的字符串时,结果会发生变化:

In [8]: %time "ab" in large[::-1]                                                                                                                    
CPU times: user 99.2 ms, sys: 44.1 ms, total: 143 ms
Wall time: 143 ms
Out[8]: False

In [9]: %time "ab" in reversed(large)                                                                                                                
CPU times: user 1.73 s, sys: 4.48 ms, total: 1.73 s
Wall time: 1.74 s
Out[9]: False
In [10]: %time "abc" in large[::-1]                                                                                                                  
CPU times: user 125 ms, sys: 20 ms, total: 145 ms
Wall time: 145 ms
Out[10]: False

In [11]: %time "abc" in reversed(large)                                                                                                              
CPU times: user 1.72 s, sys: 6.52 ms, total: 1.73 s
Wall time: 1.74 s
Out[11]: False


引擎盖下发生了什么?

最佳答案

两者并不相同,可能会产生不同的 bool 结果。例如:

s = "ab"
print("ba" in s[::-1])  # True
print("ba" in reversed(s))  # False
in字符串上的运算符具有不同的行为:它查找子字符串匹配。 in迭代器上的运算符将尝试在单独迭代的值上找到匹配项,即在这种情况下是单个字符。
所以你不能真正比较这些。
至于为什么拿到False比较慢结果:迭代器将为每个迭代字符创建单独的字符串,然后从头开始比较针字符串(“ba”)。
在字符串版本中,有一种优化的搜索算法,可以在较大的字符串中查找子字符串,这是Python的一种操作。高效的字符串搜索算法是在较低级别的代码中实现的,例如 C。

关于python - 为什么在 `reversed` 字符串中搜索更大的字符串比切片反转花费更多的时间?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68335802/

相关文章:

CSS3 无法反转动画

python - 如何使用 Flask 服务器的请求模块进行 POST?

c++ - 我应该传递一个 std::vector 还是固定数量的参数?

php - glob() — 按名称排序

performance - Spark "always"中的随机播放是否会移动数据,即使在微不足道的情况下也是如此?

c# - 为什么 Any 比 Contains 慢?

c - 此代码如何反转数字中的位?

python - 使用文件夹名称作为文本文件中的一列

Python递归仅在必要时评估

python - QGraphicsView 未在 QMainWindow 中显示