我有一个数据框,其中有两列名为 nan 的列,它们不是字符串。我怎样才能删除这些?
我尝试过
df.drop(np.nan, axis=1)
这不起作用。
我通过重命名 nans 找到了一种肮脏的方法,如下所示:
df.columns= df.columns.fillna('type')
df.drop('type', axis=1)
但是我不认为这是最有效的方法。有没有更好的方法来删除名为 nans 的列?
最佳答案
对我来说,你的解决方案有效:
df = df.drop(np.nan, axis=1)
另一种解决方案是通过 bool 掩码删除:
df = pd.DataFrame({'A':list('abcdef'),
'B':[4,5,4,5,5,4],
np.nan:[7,8,9,4,2,3],
'D':[1,3,5,7,1,0],
'E':[5,3,6,9,2,4],
'F':list('aaabbb')})
df = df.loc[:, pd.notnull(df.columns)]
print (df)
A B D E F
0 a 4 1 5 a
1 b 5 3 3 a
2 c 4 5 6 a
3 d 5 7 9 b
4 e 5 1 2 b
5 f 4 0 4 b
详细信息:
print (pd.notnull(df.columns))
[ True True False True True True]
关于Python:删除 NaN 命名的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51188058/