如何使用 pandas 根据第三列中的条件在两列之间进行选择?
在 Excel 中我会使用类似的东西: NEW_COLUMN = IF(条件 == TRUE,第 1 列,第 2 列)。我无法使用 lambda 函数。
最佳答案
使用numpy.where
:
df['NEW_COLUMN'] = np.where(CONDITION, df['COLUMN 1'] , df['COLUMN 2'])
示例:
df = pd.DataFrame({'COL':[4,5,4],
'COLUMN 1':[7,8,9],
'COLUMN 2':[1,3,5],})
df['NEW_COLUMN'] = np.where(df['COL'] == 4, df['COLUMN 1'] , df['COLUMN 2'])
print (df)
COL COLUMN 1 COLUMN 2 NEW_COLUMN
0 4 7 1 7
1 5 8 3 3
2 4 9 5 9
关于python - 根据 pandas 第三列中的条件在两列中的值之间进行选择,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49239270/