我在 Pandas 数据框下面。
group A B C D E
0 g1 12 14 26 68 83
1 g1 56 58 67 34 97
2 g1 47 87 23 87 90
3 g2 43 76 98 32 78
4 g2 32 56 36 87 65
5 g2 54 12 24 45 95
我希望将 groupby 应用到同一列“group”上,并希望应用聚合函数来获取(最后一个 - 首先)列“E”。预期输出:
group A B C D E
0 g1 12 87 116 34 7
1 g2 43 12 158 32 17
我写了下面的代码。但它不起作用。import pandas as pd
df = pd.DataFrame([["g1", 12, 14, 26, 68, 83], ["g1", 56, 58, 67, 34, 97], ["g1", 47, 87, 23, 87, 90], ["g2", 43, 76, 98, 32, 78], ["g2", 32, 56, 36, 87, 65], ["g2", 54, 12, 24, 45, 95]], columns=["group", "A", "B", "C", "D", "E"])
ndf = df.groupby(["group"], as_index=False).agg({"A": 'first', "B": 'last', "C": 'sum', "D": 'min', "E": 'last - first'})
print(df)
print(ndf)
最佳答案
您可以使用 lambda
为此功能。
ndf = (
df.groupby(["group"], as_index=False)
.agg({"A": 'first',
"B": 'last',
"C": 'sum',
"D": 'min',
"E": lambda x: x.iat[-1]-x.iat[0]})
)
会输出 group A B C D E
0 g1 12 87 116 34 7
1 g2 43 12 158 32 17
关于python-3.x - 在 groupby 之后需要有关 agg 功能的帮助以进行最后的操作 - 首先,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63039527/