我正在尝试将一个具有多个参数的函数应用于数据框,其中两个需要分配给数据框的行,一个是变量(一个简单的数字)。
类似线程的变体适用于行:(与我原来的函数相比,所有函数都过于简单了)
import pandas as pd
dict={'a':[-2,5,4,-6], 'b':[4,4,5,-8]}
df=pd.DataFrame (dict)
print(df)
def DummyFunction (row):
return row['a']*row['b']
#this works:
df['Dummy1']=df.apply(DummyFunction, axis=1)
但是我怎样才能应用下面的变化,我的函数接受一个额外的参数(一个固定变量)?我似乎找不到在 apply 方法中传递它的方法:
def DummyFunction2(row, threshold):
return row['a']*row['b']*threshold
# where threshold will be assigned to a number?
# I don't seem to find a viable option to fill the row argument below:
# df['Dummy2']=df.apply(DummyFunction2(row,1000), axis=1)
感谢您的帮助!
最佳答案
您可以将附加变量作为命名参数直接传递给 pd.DataFrame.apply
:
def DummyFunction2(row, threshold):
return row['a']*row['b']*threshold
df['Dummy2'] = df.apply(DummyFunction2, threshold=2, axis=1)
关于python - Pandas:应用一个以列和变量作为参数的函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50071669/