python - Pandas groupby 从父数据框继承组?

标签 python pandas pandas-groupby

我正在尝试按分类变量 installation_id 进行分组。出于某种原因,groupby 似乎包含不在数据框本身中的组。例如:

df.groupby('installation_id').size() # Length of each group

installation_id
0001e90f     0
000447c4     0
0006a69f    16
0006c192     7
0009a5a9     0
            ..

我不希望任何组有 0 行。

此数据框是作为较大数据框的子集制作的,所以我假设它是从较大数据框继承组?我该如何防止这种情况发生才能获得预期的结果?

我在分组之前尝试过 df = df.copy() ,这没有什么区别。

感谢您的帮助,我对此比较陌生!

最佳答案

这是按分类数据分组的功能

改为使用:

df.groupby(df['installation_id'].to_numpy()).size()

或者更简单,来自 ALollz (如果ALollz回复会删)

df.groupby('installation_id', observed=True).size()

关于python - Pandas groupby 从父数据框继承组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59636849/

相关文章:

python - 如何从 python 中调用 python click ?

python - 如何正确舍入数据框列?

python - 如何将 for 循环中的 .pkl 文件 append 到 for 循环中创建的 pandas 数据帧?

python - 如何创建从另一列分组的新列(例如年龄组)

pandas - 如果另一列中的值较差,则汇总一列(不使用 for 循环)

python - 如何平滑和绘制 x 与 y 的加权平均值,由 x 加权?

python - 根据另一个数据框检查数据框中的值并附加值(如果存在)

python - 如何将元组深度连接到字符串中

python - Groupby Pandas DataFrame 列表中的项目

python - 减少 Flask-Admin 中列的大小