总而言之:我需要编写一个 List Comprehension,其中我引用了由 List Comprehension 创建的列表。
这可能不是您每天都需要做的事情,但我认为这也不罕见。
也许这里没有答案——不过,请不要告诉我应该使用 for 循环。这可能是正确的,但没有帮助。原因是问题域:这行代码是 ETL 模块的一部分,因此性能是相关的,避免创建临时容器的需要也是如此——因此我希望在 L/C 中编写这一步。如果 for 循环在这里对我有用,我会编写一个代码。
无论如何,我无法写出这个特定的列表理解。原因:我需要编写的表达式具有以下形式:
[ some_function(s) for s in raw_data if s not in this_list ]
在该伪代码中,“this_list”指的是通过评估该列表理解创建的列表。这就是我被卡住的原因——因为 this_list 直到我的列表理解被评估后才建立,而且因为这个列表在我需要引用它的时候还没有建立,我不知道如何引用
到目前为止我所考虑的(并且可能基于一个或多个错误假设,尽管我不知道确切的位置):
难道python解释器没有 给出这个正在 build 中的列表 一个名字?我想是的
该临时名称可能已被占用 来自一些用于构建的绑定(bind)方法 我的列表('sum'?)
但即使我不厌其烦 找到绑定(bind)方法并假设 它确实是临时名称 python解释器用来 在列表下方时引用列表 施工,我很确定你 不能引用绑定(bind)方法 直接地;我不知道这样的 明确的规则,但那些方法(在 至少我实际上拥有的少数 看着) 是无效的 python 句法。我猜其中一个原因 是为了让我们不把它们写进 我们的代码。
所以这就是我所谓的推理链,它让我得出结论,或者至少是猜测,我已经把自己逼到了一个角落。我仍然认为我应该在转身并转向不同的方向之前与社区核实这一点。
最佳答案
过去有一种方法可以使用未记录的事实来执行此操作,即在构建列表时,其值存储在名为 _[1].__self__
的局部变量中。然而,它在 Python 2.7 中停止工作(可能更早,我没有密切关注)。
如果您首先设置一个外部数据结构,您可以在单个列表理解中做您想做的事。由于您所有的伪代码似乎都在使用 this_list
检查它以查看每个 s
是否已经在其中 - 即成员资格测试 - 我已经改变了它进入名为 seen
的 set
作为优化(如果列表很大,检查 list
中的成员资格可能会非常慢)。这就是我的意思:
raw_data = [c for c in 'abcdaebfc']
seen = set()
def some_function(s):
seen.add(s)
return s
print [ some_function(s) for s in raw_data if s not in seen ]
# ['a', 'b', 'c', 'd', 'e', 'f']
如果您无权访问 some_function
,您可以在您自己的包装函数中调用它,在返回之前将其返回值添加到 seen
集
即使它不是列表理解,我也会将整个东西封装在一个函数中以便于重用:
def some_function(s):
# do something with or to 's'...
return s
def add_unique(function, data):
result = []
seen = set(result) # init to empty set
for s in data:
if s not in seen:
t = function(s)
result.append(t)
seen.add(t)
return result
print add_unique(some_function, raw_data)
# ['a', 'b', 'c', 'd', 'e', 'f']
无论哪种情况,我都觉得奇怪的是,您要引用的伪代码中构建的列表不是由 raw_data
值的子集组成,而是调用 的结果code>some_function
它们中的每一个——即转换后的数据——这自然让人想知道 some_function
做了什么使得它的返回值可能匹配现有的 raw_data
元素的值(value)。
关于python - 列表理解 : References to the Components,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5056297/