python - 列表理解 : References to the Components

标签 python interpreter list-comprehension internals

总而言之:我需要编写一个 List Comprehension,其中我引用了由 List Comprehension 创建的列表。

这可能不是您每天都需要做的事情,但我认为这也不罕见。

也许这里没有答案——不过,请不要告诉我应该使用 for 循环。这可能是正确的,但没有帮助。原因是问题域:这行代码是 ETL 模块的一部分,因此性能是相关的,避免创建临时容器的需要也是如此——因此我希望在 L/C 中编写这一步。如果 for 循环在这里对我有用,我会编写一个代码。

无论如何,我无法写出这个特定的列表理解。原因:我需要编写的表达式具有以下形式:

[ some_function(s) for s in raw_data if s not in this_list ]

在该伪代码中,“this_list”指的是通过评估该列表理解创建的列表。这就是我被卡住的原因——因为 this_list 直到我的列表理解被评估后才建立,而且因为这个列表在我需要引用它的时候还没有建立,我不知道如何引用

到目前为止我所考虑的(并且可能基于一个或多个错误假设,尽管我不知道确切的位置):

  • 难道python解释器没有 给出这个正在 build 中的列表 一个名字?我想是的

  • 该临时名称可能已被占用 来自一些用于构建的绑定(bind)方法 我的列表('sum'?)

  • 但即使我不厌其烦 找到绑定(bind)方法并假设 它确实是临时名称 python解释器用来 在列表下方时引用列表 施工,我很确定你 不能引用绑定(bind)方法 直接地;我不知道这样的 明确的规则,但那些方法(在 至少我实际上拥有的少数 看着) 是无效的 python 句法。我猜其中一个原因 是为了让我们不把它们写进 我们的代码。

所以这就是我所谓的推理链,它让我得出结论,或者至少是猜测,我已经把自己逼到了一个角落。我仍然认为我应该在转身并转向不同的方向之前与社区核实这一点。

最佳答案

过去有一种方法可以使用未记录的事实来执行此操作,即在构建列表时,其值存储在名为 _[1].__self__ 的局部变量中。然而,它在 Python 2.7 中停止工作(可能更早,我没有密切关注)。

如果您首先设置一个外部数据结构,您可以在单个列表理解中做您想做的事。由于您所有的伪代码似乎都在使用 this_list 检查它以查看每个 s 是否已经在其中 - 即成员资格测试 - 我已经改变了它进入名为 seenset 作为优化(如果列表很大,检查 list 中的成员资格可能会非常慢)。这就是我的意思:

raw_data = [c for c in 'abcdaebfc']

seen = set()
def some_function(s):
    seen.add(s)
    return s

print [ some_function(s) for s in raw_data if s not in seen ]
# ['a', 'b', 'c', 'd', 'e', 'f']

如果您无权访问 some_function,您可以在您自己的包装函数中调用它,在返回之前将其返回值添加到 seen

即使它不是列表理解,我也会将整个东西封装在一个函数中以便于重用:

def some_function(s):
    # do something with or to 's'...
    return s

def add_unique(function, data):
    result = []
    seen = set(result) # init to empty set
    for s in data:
        if s not in seen:
            t = function(s)
            result.append(t)
            seen.add(t)
    return result

print add_unique(some_function, raw_data)
# ['a', 'b', 'c', 'd', 'e', 'f']

无论哪种情况,我都觉得奇怪的是,您要引用的伪代码中构建的列表不是由 raw_data 值的子集组成,而是调用 的结果code>some_function 它们中的每一个——即转换后的数据——这自然让人想知道 some_function 做了什么使得它的返回值可能匹配现有的 raw_data元素的值(value)。

关于python - 列表理解 : References to the Components,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5056297/

相关文章:

python - pySerial + SIM800/900 AT 命令 - 读缓冲区包含之前的写缓冲区数据

python - 在 Python 解释器中,返回没有 "'"

haskell - Haskell 列表推导式中的 OR 条件

c# - 如何在 C# 中进行列表理解(将列表转换为另一个列表的紧凑方式)?

python - 如何在 Python 3.5 中使用 unittest.mock 模拟导入的库方法?

python - 如何使用pyspark创建包含大量列和日期数据的数据框?

python - 如何使用函数的返回值作为 while 的条件,在 python 中返回元组

c - Brainfuck 解释器在 c 打印中遇到麻烦

python - 在交互式 shell 中运行 python 脚本与在 Linux(ubuntu 13) 的终端中运行 python 脚本有什么区别?

python - 列表外的 "list comprehension"样式语法?