我正在使用看起来像这样的 pandas df:
ID time
34 43
2 99
2 20
34 8
2 90
创建代表每个 ID 与最近时间的差异的变量的最佳方法是什么?
ID time diff
34 43 35
2 99 9
2 20 NA
34 8 NA
2 90 70
最佳答案
有一种可能
df["diff"] = df.sort_values("time").groupby("ID")["time"].diff()
df
ID time diff
0 34 43 35.0
1 2 99 9.0
2 2 20 NaN
3 34 8 NaN
4 2 90 70.0
关于python - 通过id创建时差变量的最佳方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39336234/