一定有一个我没有意识到的简单解决方案。我需要考虑数据帧的两列来替换其中一列中的 NaN 值。对于这个集合,我得到了正确的答案,但在替换 q2 的缺失值之前,我需要确保 q1 为 0,q2 为 NaN,而不仅仅是我在这里所做的 q1 为 0:
import pandas as pd
import numpy as np
df = pd.DataFrame({'ID':[1,2,3,4,5,6], 'q1':[0,0,1,1,0,1], 'q2': [np.nan, np.nan, np.nan, 29, np.nan, 18]})
print df
ID q1 q2
0 1 0 NaN
1 2 0 NaN
2 3 1 NaN
3 4 1 29
4 5 0 NaN
5 6 1 18
df.loc[df.q1 ==0, 'q2']= 999
print df
ID q1 q2
0 1 0 999
1 2 0 999
2 3 1 NaN
3 4 1 29
4 5 0 999
5 6 1 18
我已经尝试过了,但它没有考虑 q2
df.loc[(df['q1'] == 0) & (df['q2']==np.nan), 'q2'] = 999
最佳答案
需要isnull
用于检查 NaN:
df.loc[(df['q1'] == 0) & (df['q2'].isnull()), 'q2'] = 999
print (df)
ID q1 q2
0 1 0 999.0
1 2 0 999.0
2 3 1 NaN
3 4 1 29.0
4 5 0 999.0
5 6 1 18.0
<小时/>
为了更好地测试,更改了一些值:
df = pd.DataFrame({'ID':[1,2,3,4,5,6],
'q1':[0,0,1,1,0,1],
'q2': [np.nan, 1.0, np.nan, 29, np.nan, 18]})
print (df)
ID q1 q2
0 1 0 NaN
1 2 0 1.0
2 3 1 NaN
3 4 1 29.0
4 5 0 NaN
5 6 1 18.0
df.loc[(df['q1'] == 0) & (df['q2'].isnull()), 'q2'] = 999
print (df)
ID q1 q2
0 1 0 999.0
1 2 0 1.0
2 3 1 NaN
3 4 1 29.0
4 5 0 999.0
5 6 1 18.0
替代解决方案 mask
或numpy.where
:
df['q2'] = df['q2'].mask((df['q1'] == 0) & (df['q2'].isnull()), 999)
print (df)
ID q1 q2
0 1 0 999.0
1 2 0 1.0
2 3 1 NaN
3 4 1 29.0
4 5 0 999.0
5 6 1 18.0
<小时/>
df['q2'] = np.where((df['q1'] == 0) & (df['q2'].isnull()), 999,df['q2'])
print (df)
ID q1 q2
0 1 0 999.0
1 2 0 1.0
2 3 1 NaN
3 4 1 29.0
4 5 0 999.0
5 6 1 18.0
关于python - 替换两列中的值pandas一个条件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44780210/