python - Pandas groupby 从父数据框继承组？

我正在尝试按分类变量 installation_id 进行分组。出于某种原因，groupby 似乎包含不在数据框本身中的组。例如:

df.groupby('installation_id').size() # Length of each group

installation_id
0001e90f     0
000447c4     0
0006a69f    16
0006c192     7
0009a5a9     0
            ..

我不希望任何组有 0 行。

此数据框是作为较大数据框的子集制作的，所以我假设它是从较大数据框继承组？我该如何防止这种情况发生才能获得预期的结果？

我在分组之前尝试过 df = df.copy() ，这没有什么区别。

感谢您的帮助，我对此比较陌生!

最佳答案

这是按分类数据分组的功能。

改为使用:

df.groupby(df['installation_id'].to_numpy()).size()

或者更简单，来自 ALollz (如果ALollz回复会删)

df.groupby('installation_id', observed=True).size()

关于python - Pandas groupby 从父数据框继承组？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59636849/

上一篇：一次性进行 R POS 标记和标记化

下一篇：string - Julia : How to convert vector of type string to type numeric (Float64)

相关文章：

python - 如何从 python 中调用 python click ？

python - 如何正确舍入数据框列？

python - 如何将 for 循环中的 .pkl 文件 append 到 for 循环中创建的 pandas 数据帧？

python - 如何创建从另一列分组的新列(例如年龄组)

pandas - 如果另一列中的值较差，则汇总一列(不使用 for 循环)

python - 如何平滑和绘制 x 与 y 的加权平均值，由 x 加权？

python - 根据另一个数据框检查数据框中的值并附加值(如果存在)

python - 如何将元组深度连接到字符串中

python - Groupby Pandas DataFrame 列表中的项目

python - 减少 Flask-Admin 中列的大小