python - 在 pandas 数据框中,如何添加一个带有分组依据的运行总计字段

标签 python pandas dataframe

我有以下数据框:

import pandas

mydata = [{'city': 'London', 'age': 75, 'fdg': 1.78},
          {'city': 'Paris', 'age': 22, 'fdg': 1.56},
          {'city': 'Paris', 'age': 32, 'fdg': 1.56},
          {'city': 'New York', 'age': 37, 'fdg': 1.56},
          {'city': 'London', 'age': 24, 'fdg': 1.56},
          {'city': 'London', 'age': 22, 'fdg': 1.56},
          {'city': 'New York', 'age': 60, 'fdg': 1.56},
          {'city': 'Paris', 'age': 22, 'fdg': 1.56},


          ]
df = pandas.DataFrame(mydata)

   age      city   fdg
0   75    London  1.78
1   22     Paris  1.56
2   32     Paris  1.56
3   37  New York  1.56
4   24    London  1.56
5   22    London  1.56
6   60  New York  1.56
7   22     Paris  1.56

我想在末尾添加一个名为age_total 的字段,它将是年龄字段的累积总计。累积计算将按城市分组进行 - 因此伦敦的第 1 行将为 75,巴黎的第 2 行将为 22,巴黎的第 3 行将为 54 - (22+32)

最佳答案

df['age_total']=df.groupby('city').cumsum()['age']

关于python - 在 pandas 数据框中,如何添加一个带有分组依据的运行总计字段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41271439/

相关文章:

python - 检查列标题是否与 PYTHON 匹配

python - 我如何创建一个脚本来制作 MLA 引文?

python 将列表转换为矩阵并获取值

python - 在 Plotly 图中将背景颜色设置为透明

python - 行过滤,以便我们只保留有限的条目

python - 如何克服 'NoneType' object has no attribute 'lower' 错误?

python - 按 dtype 和列名选择 Pandas 列

python - 如何从 pandas DataFrame 中创建字典列表?

python - 如何将一个数据框中的列添加到另一个数据框中?

python - H2O 时的 MAPE 公制