我正在尝试对 pandas df 中的列求和,其中列等于特定值。使用下面的 df,其中 ['X'] == 'GrV'
,我想对 cols ('GrV A', 'GrV B')
求和。但我正在返回 nan
值。
import pandas as pd
df = pd.DataFrame({
'X' : ['GrV', 'GrX', 'GrY', 'GrZ', 'GrV', 'GrX', 'GrY', 'GrZ'],
'GrV A' : [4, 2, 6, 5, 1, 2, 5, 6],
'GrX A' : [3, 4, 5, 1, 2, 5, 6, 2],
'GrY A' : [5, 2, 2, 6, 5, 1, 5, 4],
'GrZ A' : [1, 2, 5, 5, 2, 1, 5, 4],
'GrV B' : [4, 2, 6, 5, 1, 2, 5, 6],
'GrX B' : [3, 4, 5, 1, 2, 5, 6, 2],
'GrY B' : [5, 2, 2, 6, 5, 1, 5, 4],
'GrZ B' : [1, 2, 5, 5, 2, 1, 5, 4],
})
df['Total'] = df.loc[(df['X'] == 'GrV'), ('GrV A', 'GrV B')].sum()
df['Total'] = df.loc[(df['X'] == 'GrX'), ('GrX A', 'GrX B')].sum()
df['Total'] = df.loc[(df['X'] == 'GrY'), ('GrY A', 'GrY B')].sum()
df['Total'] = df.loc[(df['X'] == 'GrZ'), ('GrZ A', 'GrZ B')].sum()
预期输出:
X GrV A GrX A GrY A GrZ A GrV B GrX B GrY B GrZ B Total
0 GrV 4 3 5 1 4 3 5 1 8
1 GrX 2 4 2 2 2 4 2 2 8
2 GrY 6 5 2 5 6 5 2 5 4
3 GrZ 5 1 6 5 5 1 6 5 10
4 GrV 1 2 5 2 1 2 5 2 2
5 GrX 2 5 1 1 2 5 1 1 10
6 GrY 5 6 5 5 5 6 5 5 10
7 GrZ 6 2 4 4 6 2 4 4 8
最佳答案
你可以通过使用filter
来获取列Gr,使用where
通过split
得到的列名的第一个元素(到得到 GrV, GrX, ... 部分)等于列 X 和沿列的 sum
:
df['Total'] = (df.filter(like='Gr')
.where(lambda x: df['X'].to_numpy()[:, None]
== x.columns.str.split(' ').str[0].to_numpy())
.sum(axis=1)
)
print (df)
X GrV A GrX A GrY A GrZ A GrV B GrX B GrY B GrZ B Total
0 GrV 4 3 5 1 4 3 5 1 8.0
1 GrX 2 4 2 2 2 4 2 2 8.0
2 GrY 6 5 2 5 6 5 2 5 4.0
3 GrZ 5 1 6 5 5 1 6 5 10.0
4 GrV 1 2 5 2 1 2 5 2 2.0
5 GrX 2 5 1 1 2 5 1 1 10.0
6 GrY 5 6 5 5 5 6 5 5 10.0
7 GrZ 6 2 4 4 6 2 4 4 8.0
关于python - 对行值等于标题的列求和 - Pandas,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62142973/