python - 在groupby之后对每个组进行相当复杂的计算

我有一个像这样的数据框

import pandas as pd
A = ['x' , 'x', 'y', 'y', 'y']
B = [1, 3, 2, 1, 4]
C = [2, 3, 7, 2, 1]
df = pd.DataFrame({'A' : A, 'B' : B, 'C' : C })
df

不幸的是，我无法在 df.groupby(['A']) 之后对每组进行此计算:乘B按元素排列C元素并对它们求和，然后除以 B 的元素总和因此有以下内容:

df1 = pd.DataFrame({'A' : ['x', 'y'], '(B*C)/B' : [(1*2 + 3*3)/(1+3) , (2*7+1*2+4*1)/(2+1+4)]})
df1

最佳答案

您可以申请:

df.groupby('A').apply(lambda x: (x['B']*x['C']).sum()/x['B'].sum())

或者类似的:

df.groupby('A').apply(lambda x: np.average(x['C'],weights=x['B']) )

输出:

A
x    2.750000
y    2.857143
dtype: float64

关于python - 在groupby之后对每个组进行相当复杂的计算，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/65242255/

相关文章：

Python:为什么 dict.fromkeys 方法不生成工作字典