我有大 DataFrame (df),它看起来像:
Acc_num date_diff 0 29 0:04:43 1 29 0:01:43 2 29 2:22:45 3 29 0:16:21 4 29 0:58:20 5 30 0:00:35 6 34 7:15:26 7 34 4:40:01 8 34 0:56:02 9 34 6:53:44 10 34 1:36:58 ..... Acc_num int64 date_diff timedelta64[ns] dtype: object
我需要计算每个帐号的“date_diff”均值(时间增量格式)。
df.date_diff.mean()
工作正常。但是当我接下来尝试时:
df.groupby('Acc_num').date_diff.mean()
它引发异常:
"DataError: No numeric types to aggregate"
我也尝试了 df.pivot_table()
方法,但没有实现任何目标。
有人可以帮我解决这个问题吗?提前致谢!
最佳答案
确实有奇怪的限制。但一个简单的解决方案是:
df.groupby('Acc_num').date_diff.agg(lambda g:g.sum()/g.count())
编辑:
如果您传递 numeric_only=False
df.groupby('Acc_num').date_diff.mean(numeric_only=False)
关于python - Python DataFrame 中 Timedelta 值的聚合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45239742/