我有一本可以任意长度的字典,例如这个:
dic = {'A':'Rome','B':'Japan','C':'EUA'}
我想构建一个函数,使用上面的字典作为参数来过滤数据帧,如下所示:
def filter(dic, df):
for k,v in dic.items():
x=df[(df[k]==v) & (df[k]==v) & (df[k]==v)]
return x
如果我必须对上面的过滤器进行硬编码:
df[(df['A']=='Rome') & (df['B']=='Japan') & (df['C']=='EUA')]
我面临的问题:
字典没有固定长度,因此参数的数量每次都会改变。
上面的代码没有正确迭代字典
如何使该过滤功能发挥作用?
最佳答案
假设dic
字典包含所有列,只需使用:
df[df.eq(dic).all(axis=1)]
否则,使用:
df[df[list(dic)].eq(dic).all(axis=1)]
示例:
dic = {'A':'Rome','B':'Japan','C':'EUA'}
df = pd.DataFrame({'A': ['Rome', 'Rome', 'Milan'],
'B': ['Japan', 'Italy', 'Japan'],
'C': ['EUA', 'Italy', 'Japan'],
'D': [1,2,3]
})
df[df[list(dic)].eq(dic).all(axis=1)]
输出:
A B C D
0 Rome Japan EUA 1
关于pandas - 如何使用 key :value pairs from a dict to build a pandas filter,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71883091/