我有一个具有以下格式的数据框:
sacc_id$ id$ creation_date
0 001A000000hwvV0IAI 5001200000ZnfUgAAJ 2016-06-07 14:38:02
1 001A000000hwvV0IAI 5001245600ZnfUgAAJ 2016-06-07 15:31:02
2 002A000000hwvV0IAI 5001245600ZnfUgAAJ 2016-06-07 15:41:02
我想为此数据框添加一个计数列,该列对过去 3 个月内每个 sacc_id$ 的数字 id$ 进行计数。
我确实喜欢这样:
df_case = (pd.to_datetime(df_case['creation_date'])
.value_counts()
.rename_axis('date')
.reset_index(name='count'))
但还没有完成。
你能帮我吗?
谢谢
最佳答案
试试这个:
df_case[pd.to_datetime(df_case['creation_date']) > (datetime.date.today() - datetime.timedelta(days=90)) ].groupby('sacc_id')['id'].count()
关于python - 按日期统计组数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54911542/