Pandas 计数聚合忽略了 nan 的计数。我需要一个包含它们的计数。 Numpy 有一些聚合,但不是所有 nan 修改聚合,我是否必须使用自定义聚合,或者有没有办法做到这一点,我找不到?
这是针对 groupby 的,我想要正常的 NaN 功能来表示均值,但对计数来说很奇怪。在代码中
In [1]: import numpy
In [2]: import pandas as pd
In [3]: df = pd.DataFrame([[0,float('nan')],[0,float('nan')],[0,float('nan')]])
In [4]: df.groupby(0).agg(['count', 'mean'])
Out[4]:
1
count mean
0
0 0 NaN
我希望输出是 3 Nan 而不是 0 NaN。
最佳答案
只需使用 len()
size = lambda x: len(x)
df.groupby(0).agg(['count', 'mean', 'size'])
输出:
1
count mean size
0
0 0 NaN 3
关于numpy - 用 nans 计数的 Pandas 聚合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36252934/