我正在尝试按分类变量 installation_id
进行分组。出于某种原因,groupby 似乎包含不在数据框本身中的组。例如:
df.groupby('installation_id').size() # Length of each group
installation_id
0001e90f 0
000447c4 0
0006a69f 16
0006c192 7
0009a5a9 0
..
我不希望任何组有 0 行。
此数据框是作为较大数据框的子集制作的,所以我假设它是从较大数据框继承组?我该如何防止这种情况发生才能获得预期的结果?
我在分组之前尝试过 df = df.copy()
,这没有什么区别。
感谢您的帮助,我对此比较陌生!
最佳答案
这是按分类数据分组的功能。
改为使用:
df.groupby(df['installation_id'].to_numpy()).size()
或者更简单,来自 ALollz (如果ALollz回复会删)
df.groupby('installation_id', observed=True).size()
关于python - Pandas groupby 从父数据框继承组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59636849/