python - 列表的 boolean 掩码作为 Pandas 数据框中的条目

我有一个包含列表作为条目的 pandas DataFrame

data = {'col1': [
['foo', 'bar', 'baz'], 
['cat', 'dog', 'horse'], 
[1, 2, 3]
]}

df = pd.DataFrame(data)

然后，如果“foo”在任何行的列表中(在本例中为第 0 行)，我想使用 boolean 掩码返回行。以下将返回一个空的 DataFrame:

df[df['col1'] == 'foo']

实现上述目标的最佳方法如下:

df[df['col1'].apply(lambda x: True if 'foo' in x else False)]

但我觉得有一种方法可以简化这段代码。有什么建议吗？

最佳答案

正如 Henry 已经在评论中发布的那样，如果您在 lambda 中使用 'foo' in x，则可以缩减代码。对我来说，这看起来足够 pythonic。

完整的行是

df[df["col1"].apply(lambda x: 'foo' in x)]

如果你想避免使用 lambda 表达式，你可以使用:

def inside(my_list, key): return key in my_list
out = df[df["col1"].apply(inside, key="foo")]

这使用了一个预先定义的函数，它可以被扩展。这对于 lambda 表达式是不可能的。

关于python - 列表的 boolean 掩码作为 Pandas 数据框中的条目，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63381888/

相关文章：

Python:打印 protobuf 规范(字段、类型)