假设我有一个像这样的数据框:
df= { 'class': ['A','A','A','A','A','B','B','B','B'],
'ID':[1,2,2,3,3,4,4,4,5]}
Class ID
A 1
A 2
A 2
A 3
A 3
B 4
B 4
B 4
B 5
我想将数据总结如下:
Class count(distinct(ID))
A 3
B 2
我知道这很微不足道,但我被困在这里:
df.groupby(by=['Class', 'ID']).count()
这给了我
由于某种原因,我似乎无法在分组后得到总和。 谢谢。
最佳答案
我认为您正在寻找 nunique
:
In [11]: df.groupby("Class")["ID"].nunique()
Out[11]:
Class
A 3
B 2
Name: ID, dtype: int64
关于python - Pandas 中的分组和求和,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34235603/