python - 通过id创建时差变量的最佳方法

标签 python pandas

我正在使用看起来像这样的 pandas df:

ID time
34  43
2   99
2   20
34  8
2   90

创建代表每个 ID 与最近时间的差异的变量的最佳方法是什么?

ID time diff
34  43   35
2   99   9
2   20   NA
34  8    NA
2   90   70

最佳答案

有一种可能

df["diff"] = df.sort_values("time").groupby("ID")["time"].diff()
df

    ID  time diff
0   34  43   35.0
1   2   99   9.0
2   2   20   NaN
3   34  8    NaN
4   2   90   70.0

关于python - 通过id创建时差变量的最佳方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39336234/

相关文章:

python - 如何使用 python 请求将字符串传递给 post 调用

python - 我什么时候应该写一个类而不是一组函数?

python - 从pd数据帧到Excel的分层索引,需要转发填充和取消合并

python - 从数据框中列表内的字典中提取元素

Pandas read_excel : only read first few lines

python - wxpython 和类之间共享变量

python - 正常关闭、关闭数据库连接、打开文件、停止在 SIGTERM 上工作、在多处理中

python - 循环此代码以根据先前计算的数据帧获取新的数据帧?

pandas - pandas中agg()和aggregate()函数的区别

python - Many-Hot(N-hot)编码 - 快速 Pandas 方法?