我迷失在 Pandas 文档和功能中,试图找出一种方法,通过列的总和值来groupby
DataFrame
。
例如,假设我有以下数据:
In [2]: dat = {'a':[1,0,0], 'b':[0,1,0], 'c':[1,0,0], 'd':[2,3,4]}
In [3]: df = pd.DataFrame(dat)
In [4]: df
Out[4]:
a b c d
0 1 0 1 2
1 0 1 0 3
2 0 0 0 4
我希望将列 a
、b
和 c
分组,因为它们的总和都等于 1。生成的 DataFrame 将列标签等于它求和的列的总和。像这样:
1 9
0 2 2
1 1 3
2 0 4
有什么想法可以让我朝着好的方向发展吗?提前致谢!
最佳答案
给你:
In [57]: df.groupby(df.sum(), axis=1).sum()
Out[57]:
1 9
0 2 2
1 1 3
2 0 4
[3 rows x 2 columns]
df.sum()
是您的石斑鱼。它在 0 轴(索引)上求和,为您提供两组:1
(列 a
、b
和 c
) 和 9
(d
列)。您想要对列 (axis=1
) 进行分组,并计算每组的总和。
关于python - 按 Pandas 列总和的值分组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21584434/