我有以下数据框:
import pandas
mydata = [{'city': 'London', 'age': 75, 'fdg': 1.78},
{'city': 'Paris', 'age': 22, 'fdg': 1.56},
{'city': 'Paris', 'age': 32, 'fdg': 1.56},
{'city': 'New York', 'age': 37, 'fdg': 1.56},
{'city': 'London', 'age': 24, 'fdg': 1.56},
{'city': 'London', 'age': 22, 'fdg': 1.56},
{'city': 'New York', 'age': 60, 'fdg': 1.56},
{'city': 'Paris', 'age': 22, 'fdg': 1.56},
]
df = pandas.DataFrame(mydata)
age city fdg
0 75 London 1.78
1 22 Paris 1.56
2 32 Paris 1.56
3 37 New York 1.56
4 24 London 1.56
5 22 London 1.56
6 60 New York 1.56
7 22 Paris 1.56
我想在末尾添加一个名为age_total 的字段,它将是年龄字段的累积总计。累积计算将按城市分组进行 - 因此伦敦的第 1 行将为 75,巴黎的第 2 行将为 22,巴黎的第 3 行将为 54 - (22+32)
最佳答案
df['age_total']=df.groupby('city').cumsum()['age']
关于python - 在 pandas 数据框中,如何添加一个带有分组依据的运行总计字段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41271439/