python - Pandas 中的累积总和从零开始，以除最后一个条目以外的所有组的总和结束

在下面的数据框中，我想创建一个新列 C这将是 B 的累积和对于 A 中的每个组列，但这些总和必须从零开始，并且只添加值直到该组的倒数第二个条目。

所以，我的结果应该是:

(我认为这个问题真的很明显，但不知何故我自己无法弄清楚，也无法在任何地方看到它。)

最佳答案

尝试:

df["C"] = df.groupby("A")["B"].transform(
    lambda x: x.shift().fillna(0).cumsum().astype(int)
)
print(df)

打印:

关于python - Pandas 中的累积总和从零开始，以除最后一个条目以外的所有组的总和结束，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/69092524/

相关文章：

python - 根据另一列的值从一列中提取模式