python - Python `list.extend(iterator)` 保证是惰性的吗?

标签 python list data-structures iterator lazy-evaluation

总结

假设我有一个 iterator,当从中消耗元素时,它会执行一些副作用,例如修改列表。如果我定义一个列表 l 并调用 l.extend(iterator),是否保证 extend 会将元素推送到 l 一个接一个,因为迭代器中的元素被消耗,而不是保存在缓冲区中然后一次全部推送?

我的实验

我在我的计算机上用 Python 3.7 做了一个快速测试,根据该测试,list.extend 似乎很懒惰。 (请参阅下面的代码。)规范是否保证了这一点?如果是,规范中的何处提到了这一点?

(此外,请随时批评我并说“这不是 Pythonic,你这个傻瓜!”——尽管如果你想批评我也能回答这个问题,我将不胜感激。我问的部分原因出于我自己的好奇心。)

假设我定义了一个在运行时推送到列表的迭代器:

l = []

def iterator(k):
  for i in range(5):
    print([j in k for j in range(5)])
    yield i

l.extend(iterator(l))

以下是非惰性(即缓冲)与惰性可能的 extend 实现的示例:

def extend_nonlazy(l, iterator):
  l += list(iterator)

def extend_lazy(l, iterator):
  for i in iterator:
    l.append(i)

结果

下面是当我运行 extend 的两个已知实现时会发生什么。


非懒惰:

l = []
extend_nonlazy(l, iterator(l))
# output
[False, False, False, False, False]
[False, False, False, False, False]
[False, False, False, False, False]
[False, False, False, False, False]
[False, False, False, False, False]

# l = [0, 1, 2, 3, 4]

懒惰:

l = []
extend_lazy(l, iterator(l))
[False, False, False, False, False]
[True, False, False, False, False]
[True, True, False, False, False]
[True, True, True, False, False]
[True, True, True, True, False]

我自己的实验表明,原生 list.extend 似乎像惰性版本一样工作,但我的问题是:Python 规范是否保证这一点?

最佳答案

我不认为问题是惰性非惰性,因为无论是在切片分配还是在列表扩展中,您都需要迭代器的元素和这些元素被消耗一次(在正常情况下)。你提出的问题更重要:这些操作是原子的还是不是原子的?请参阅 Wikipedia 中“原子性”的一个定义。 :

Atomicity guarantees that each transaction is treated as a single "unit", which either succeeds completely, or fails completely.

看看这个例子(CPython 3.6.8):

>>> def new_iterator(): return (1/(i-2) for i in range(5))
>>> L = []
>>> L[:] = new_iterator()
Traceback (most recent call last):
...
ZeroDivisionError: division by zero
>>> L
[]

切片分配因异常而失败(i == 2 => 1/(i - 2) 引发异常)并且列表是保持不变。因此,切片赋值操作是原子的

现在,同样的例子:extend:

>>> L.extend(new_iterator())
Traceback (most recent call last):
...
ZeroDivisionError: division by zero
>>> L
[-0.5, -1.0]

引发异常时,前两个元素已附加到列表中。 extend 操作不是原子的,因为失败不会使列表保持不变。

extend 操作是否应该是原子的?坦率地说,我对此一无所知,但正如@wim 的回答中所写,真正的问题是文档中没有明确说明(更糟糕的是,文档 asserts 认为 extend 等同于切片分配,这在引用实现中是不正确的)。

关于python - Python `list.extend(iterator)` 保证是惰性的吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57194152/

相关文章:

javascript - 将数据与数据哈希分离

java - 存储 3 列 Oracle 表的最佳 Java 数据结构? 3列数组?还是双 map ?

python - IPython 和 REPL 在没有打印功能的情况下显示数据时表现不同

python - jitclass 属性中的空集

python - 查找数据帧行中值变为负值的位置并返回相应的列

android - 在 jython 中编写 Android 应用程序

python - 用空格填充列表元素给定最小长度

python - 在Python中查找列表中所有单词的字符数

java - 如何对 Java 8 中的对象列表进行分页?

c++ - 从文件中快速加载大型数据结构