python - 根据时间分割推文

标签 python twitter

我在一个文件中有一组 json 格式的推文。每条推文中的“created_at”键如下所示:

Sun May 28 23:59:59 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:58 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:57 +0000 2017
Sun May 28 23:59:56 +0000 2017
Sun May 28 23:59:56 +0000 2017

我想每 10 秒间隔收集一次推文,并对推文进行一些计算(例如,考虑从 2017 年 5 月 28 日星期日 23:59:59 +0000 2017 到 2017 年 5 月 28 日星期日 23:59:49 +0000)下一步从 2017 年 5 月 28 日星期日 23:59:49 +0000 到 2017 年 5 月 28 日星期日 23:59:39 +0000 等等)。我怎样才能做到这一点?

最佳答案

您可以使用pandas模块使用 df = pd.read_json(filename) 从 json 创建数据帧并使用 TimeGrouper对时间间隔进行分组grouped = df.groupby(pd.TimeGrouper("10s"))。然后,您可以使用 for name, group in grouped:

遍历组
df = pd.read_json(filename)
grouped = df.groupby(pd.TimeGrouper("10s"))

for name, group in grouped:
    ...

关于python - 根据时间分割推文,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44416483/

相关文章:

python - Tweepy 与 Twitter 机器人和 Python 相关的问题

java - Twitter,获取过去 24 小时的所有推文

R - Twitter - fromJSON - 获取推文列表

php - 什么?解析错误: syntax error, unexpected T_STRING in/file/path

如果网页上没有提供图像,Twitter 会显示占位符图像

python - 如何从 python 中的 mongodb 的 pymongo 查询中获取单个值?

python - 如何(简单地)构建一个整数和 float 混合 numpy 数组

Python MySql Select 语句。来自Python 条目的Where 列

Python最佳实践: how to alias a module

python - 将 Boost Python 与 shared_ptr<const T> 一起使用