我正在 csv 文件中使用 numpy。
我有 3 列。对于“PUMA”列中的 500 个值,我想将 5 放入“HTYPE”列中。它与以下代码一起使用。但对于“PUMA”列(第 3 行)中的黑色单元格(nan),我想将“-999”放入“HTYPE”列中。使用相同的代码,它不起作用。
如果另一列中有 nan,如何使用 np.where 将值放入列中?
import pandas as pd, numpy as np
df= pd.read_csv(input_folder + input_file )
df['HTYPE'] = np.where(df['PUMA']==500, 5, df['HTYPE'] )
df['HTYPE'] = np.where(df['PUMA']==np.NaN, -999, df['HTYPE'] )
df.to_csv('output.csv', index=False)
最佳答案
需要特殊功能isna
用于检查 NaN 值:
df['HTYPE'] = np.where(df['PUMA'].isna(), -999, df['HTYPE'] )
#for oldier versions of pandas
#df['HTYPE'] = np.where(df['PUMA'].isnull(), -999, df['HTYPE'] )
因为 design :
np.nan == np.nan
False
也可以使用 numpy.select
来代替双 np.where
:
df = pd.DataFrame({'PUMA':[500,3302, np.nan, 9503],
'WGTP':[21,0,6,6],
'HTYPE':[20,0,0,0]})
print (df)
PUMA WGTP HTYPE
0 500.0 21 20
1 3302.0 0 0
2 NaN 6 0
3 9503.0 6 0
df['HTYPE'] = np.select([df['PUMA']==500, df['PUMA'].isna()],
[5, -999],
default=df['HTYPE'] )
print (df)
PUMA WGTP HTYPE
0 500.0 21 5
1 3302.0 0 0
2 NaN 6 -999
3 9503.0 6 0
关于python - 使用 numpy where : for black cell, 将新值放入列中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50784284/