python - 列表推导和生成器表达式中的 yield

标签 python generator list-comprehension yield generator-expression

以下行为对我来说似乎很违反直觉(Python 3.4):

>>> [(yield i) for i in range(3)]
<generator object <listcomp> at 0x0245C148>
>>> list([(yield i) for i in range(3)])
[0, 1, 2]
>>> list((yield i) for i in range(3))
[0, None, 1, None, 2, None]

最后一行的中间值实际上并不总是None,它们是我们发送到生成器中的任何东西,相当于(我猜)下面的生成器:

def f():
   for i in range(3):
      yield (yield i)

这三行完全有效,这让我觉得很有趣。 Referenceyield 只允许在函数定义中使用(尽管我可能读错了和/或它可能只是从旧版本复制而来)。在 Python 2.7 中,前两行会产生 SyntaxError,但第三行不会。

而且,看起来很奇怪

  • 列表推导式返回的是生成器而不是列表
  • 并且生成器表达式转换为列表和对应的列表推导包含不同的值。

有人可以提供更多信息吗?

最佳答案

Note: this was a bug in the CPython's handling of yield in comprehensions and generator expressions, fixed in Python 3.8, with a deprecation warning in Python 3.7. See the Python bug report and the What's New entries for Python 3.7 and Python 3.8.

生成器表达式、集合和字典推导被编译为(生成器)函数对象。在 Python 3 中,列表推导式得到相同的处理;它们本质上都是一个新的嵌套范围。

如果您尝试反汇编生成器表达式,您会看到这一点:

>>> dis.dis(compile("(i for i in range(3))", '', 'exec'))
  1           0 LOAD_CONST               0 (<code object <genexpr> at 0x10f7530c0, file "", line 1>)
              3 LOAD_CONST               1 ('<genexpr>')
              6 MAKE_FUNCTION            0
              9 LOAD_NAME                0 (range)
             12 LOAD_CONST               2 (3)
             15 CALL_FUNCTION            1 (1 positional, 0 keyword pair)
             18 GET_ITER
             19 CALL_FUNCTION            1 (1 positional, 0 keyword pair)
             22 POP_TOP
             23 LOAD_CONST               3 (None)
             26 RETURN_VALUE
>>> dis.dis(compile("(i for i in range(3))", '', 'exec').co_consts[0])
  1           0 LOAD_FAST                0 (.0)
        >>    3 FOR_ITER                11 (to 17)
              6 STORE_FAST               1 (i)
              9 LOAD_FAST                1 (i)
             12 YIELD_VALUE
             13 POP_TOP
             14 JUMP_ABSOLUTE            3
        >>   17 LOAD_CONST               0 (None)
             20 RETURN_VALUE

上面显示生成器表达式被编译为代码对象,作为函数加载(MAKE_FUNCTION 从代码对象创建函数对象)。 .co_consts[0]引用让我们看到为表达式生成的代码对象,它使用YIELD_VALUE就像生成器函数一样。

因此,yield表达式在该上下文中起作用,因为编译器将它们视为变相的函数。

这是一个错误; yield在这些表达中没有位置。 Python 3.7 之前的 Python grammar 允许它(这就是代码可编译的原因),但是 yield expression specification表明使用 yield这里实际上不应该工作:

The yield expression is only used when defining a generator function and thus can only be used in the body of a function definition.

这已被确认为 issue 10544 中的一个错误。 .该错误的解决方法是使用 yieldyield fromraise a SyntaxError in Python 3.8 ;在 Python 3.7 it raises a DeprecationWarning 以确保代码停止使用此构造。如果您使用 -3 command line switch,您将在 Python 2.7.15 及更高版本中看到相同的警告。启用 Python 3 兼容性警告。

3.7.0b1 警告如下所示;将警告变成错误会给你一个 SyntaxError异常(exception),就像在 3.8 中一样:

>>> [(yield i) for i in range(3)]
<stdin>:1: DeprecationWarning: 'yield' inside list comprehension
<generator object <listcomp> at 0x1092ec7c8>
>>> import warnings
>>> warnings.simplefilter('error')
>>> [(yield i) for i in range(3)]
  File "<stdin>", line 1
SyntaxError: 'yield' inside list comprehension

yield 之间的区别在列表理解和 yield在生成器表达式中,操作源于这两个表达式实现方式的差异。在 Python 3 中,列表理解使用 LIST_APPEND调用将堆栈顶部添加到正在构建的列表中,而生成器表达式则产生该值。添加 (yield <expr>)只需添加另一个 YIELD_VALUE操作码:

>>> dis.dis(compile("[(yield i) for i in range(3)]", '', 'exec').co_consts[0])
  1           0 BUILD_LIST               0
              3 LOAD_FAST                0 (.0)
        >>    6 FOR_ITER                13 (to 22)
              9 STORE_FAST               1 (i)
             12 LOAD_FAST                1 (i)
             15 YIELD_VALUE
             16 LIST_APPEND              2
             19 JUMP_ABSOLUTE            6
        >>   22 RETURN_VALUE
>>> dis.dis(compile("((yield i) for i in range(3))", '', 'exec').co_consts[0])
  1           0 LOAD_FAST                0 (.0)
        >>    3 FOR_ITER                12 (to 18)
              6 STORE_FAST               1 (i)
              9 LOAD_FAST                1 (i)
             12 YIELD_VALUE
             13 YIELD_VALUE
             14 POP_TOP
             15 JUMP_ABSOLUTE            3
        >>   18 LOAD_CONST               0 (None)
             21 RETURN_VALUE

YIELD_VALUE分别位于字节码索引 15 和 12 的操作码是额外的,是鸟巢中的杜鹃。因此,对于 list-comprehension-turned-generator,您每次都有 1 个 yield 产生堆栈顶部(用 yield 返回值替换堆栈顶部),对于生成器表达式变体,您产生顶部堆栈(整数),然后再次 yield ,但现在堆栈包含 yield 的返回值你得到None第二次。

对于列表理解,预期的 list对象输出仍然返回,但 Python 3 将其视为生成器,因此返回值改为附加到 StopIteration exception作为value属性:

>>> from itertools import islice
>>> listgen = [(yield i) for i in range(3)]
>>> list(islice(listgen, 3))  # avoid exhausting the generator
[0, 1, 2]
>>> try:
...     next(listgen)
... except StopIteration as si:
...     print(si.value)
... 
[None, None, None]

那些None对象是 yield 的返回值表达式。

再次重申这一点;同样的问题也适用于 Python 2 和 Python 3 中的字典和集合理解;在 Python 2 中 yield返回值仍被添加到预期的字典或集合对象中,并且返回值最后是'yielded'而不是附加到StopIteration。异常(exception):

>>> list({(yield k): (yield v) for k, v in {'foo': 'bar', 'spam': 'eggs'}.items()})
['bar', 'foo', 'eggs', 'spam', {None: None}]
>>> list({(yield i) for i in range(3)})
[0, 1, 2, set([None])]

关于python - 列表推导和生成器表达式中的 yield,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32139885/

相关文章:

python - numpy 数组转换成对

Python 在列表中替换

使用正则表达式过滤数据列表的 Pythonic 方法?

python - sudo pip3 install pygame 和 sudo apt install python3-pygame 有什么区别

python - 神经网络示例源代码(最好是 Python)

python - 具有较低平滑度的散点图矩阵

javascript - JavaScript for of 循环中迭代器和生成器的区别

python - 如何让生成器/迭代器在耗尽时评估为 False?

algorithm - 构造无限排序列表而不添加重复项

python - python字典理解方法中的单行if else