python - 在groupby之后对每个组进行相当复杂的计算

标签 python pandas dataframe

我有一个像这样的数据框

import pandas as pd
A = ['x' , 'x', 'y', 'y', 'y']
B = [1, 3, 2, 1, 4]
C = [2, 3, 7, 2, 1]
df = pd.DataFrame({'A' : A, 'B' : B, 'C' : C })
df

不幸的是,我无法在 df.groupby(['A']) 之后对每组进行此计算:乘B按元素排列C元素并对它们求和,然后除以 B 的元素总和因此有以下内容:

df1 = pd.DataFrame({'A' : ['x', 'y'], '(B*C)/B' : [(1*2 + 3*3)/(1+3) , (2*7+1*2+4*1)/(2+1+4)]})
df1

最佳答案

您可以申请:

df.groupby('A').apply(lambda x: (x['B']*x['C']).sum()/x['B'].sum())

或者类似的:

df.groupby('A').apply(lambda x: np.average(x['C'],weights=x['B']) )

输出:

A
x    2.750000
y    2.857143
dtype: float64

关于python - 在groupby之后对每个组进行相当复杂的计算,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65242255/

相关文章:

Python:为什么 dict.fromkeys 方法不生成工作字典

python - 从 pandas.DataFrame 的每一列中获取最大的值

python - 如何在 python 中将宇宙数据的时间戳转换为日期时间格式?

python - 即使index_col=None,Pandas read_excel有时也会创建索引

r - 将观察不完整的行添加到 data.frame

python - 如何使用 mongokit/pymongo 填充 wtform 选择字段?

python - 将单词添加到 WordNet 的本地副本

python - 如果您有数字间隔,请计算分组中位数

python - 在 pandas DataFrame 中将某些值替换为 NaN 时如何避免数据类型转换?

python - 当两个数据帧的列名称匹配时查找值