我有一个像这样的数据框
import pandas as pd
A = ['x' , 'x', 'y', 'y', 'y']
B = [1, 3, 2, 1, 4]
C = [2, 3, 7, 2, 1]
df = pd.DataFrame({'A' : A, 'B' : B, 'C' : C })
df
不幸的是,我无法在 df.groupby(['A'])
之后对每组进行此计算:乘B
按元素排列C
元素并对它们求和,然后除以 B
的元素总和因此有以下内容:
df1 = pd.DataFrame({'A' : ['x', 'y'], '(B*C)/B' : [(1*2 + 3*3)/(1+3) , (2*7+1*2+4*1)/(2+1+4)]})
df1
最佳答案
您可以申请
:
df.groupby('A').apply(lambda x: (x['B']*x['C']).sum()/x['B'].sum())
或者类似的:
df.groupby('A').apply(lambda x: np.average(x['C'],weights=x['B']) )
输出:
A
x 2.750000
y 2.857143
dtype: float64
关于python - 在groupby之后对每个组进行相当复杂的计算,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65242255/