这是对 this question 的扩展,其中 OP 想知道如何删除单列中值为 NaN 的行。
我想知道如何删除2(或更多)列中的值为两者 NaN 的行。使用第二个答案创建的数据框:
In [1]: df = pd.DataFrame(np.random.randn(10,3))
In [2]: df.ix[::2,0] = np.nan; df.ix[::4,1] = np.nan; df.ix[::3,2] = np.nan;
In [3]: df
Out[3]:
0 1 2
0 NaN NaN NaN
1 2.677677 -1.466923 -0.750366
2 NaN 0.798002 -0.906038
3 0.672201 0.964789 NaN
4 NaN NaN 0.050742
5 -1.250970 0.030561 -2.678622
6 NaN 1.036043 NaN
7 0.049896 -0.308003 0.823295
8 NaN NaN 0.637482
9 -0.310130 0.078891 NaN
如果我使用 drop.na()
命令,特别是 drop.na(subset=[1,2])
,那么它会完成一个“或”输入 drop and leaves:
In[4]: df.dropna(subset=[1,2])
Out[4]:
0 1 2
1 2.677677 -1.466923 -0.750366
2 NaN 0.798002 -0.906038
5 -1.250970 0.030561 -2.678622
7 0.049896 -0.308003 0.823295
我想要的是“and”类型的删除,它删除列索引 1 和 2 中有 NaN
的行。这将留下:
0 1 2
1 2.677677 -1.466923 -0.750366
2 NaN 0.798002 -0.906038
3 0.672201 0.964789 NaN
4 NaN NaN 0.050742
5 -1.250970 0.030561 -2.678622
6 NaN 1.036043 NaN
7 0.049896 -0.308003 0.823295
8 NaN NaN 0.637482
9 -0.310130 0.078891 NaN
只有第一行被删除。
有什么想法吗?
编辑:更改数据框值以保持一致性
最佳答案
以下两项中的任何一项:
df.dropna(subset=[1, 2], how='all')
或
df.dropna(subset=[1, 2], thresh=1)
关于Python - 如果两列为 NaN,则删除行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39128856/