我在一个文件中有一组 json 格式的推文。每条推文中的“created_at”键如下所示:
Sun May 28 23:59:59 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:56 +0000 2017
Sun May 28 23:59:56 +0000 2017
我想每 10 秒间隔收集一次推文,并对推文进行一些计算(例如,考虑从 2017 年 5 月 28 日星期日 23:59:59 +0000 2017 到 2017 年 5 月 28 日星期日 23:59:49 +0000)下一步从 2017 年 5 月 28 日星期日 23:59:49 +0000 到 2017 年 5 月 28 日星期日 23:59:39 +0000 等等)。我怎样才能做到这一点?
最佳答案
您可以使用pandas模块使用 df = pd.read_json(filename) 从 json 创建数据帧并使用 TimeGrouper对时间间隔进行分组grouped = df.groupby(pd.TimeGrouper("10s"))
。然后,您可以使用 for name, group in grouped:
df = pd.read_json(filename)
grouped = df.groupby(pd.TimeGrouper("10s"))
for name, group in grouped:
...
关于python - 根据时间分割推文,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44416483/