python - 如何在不重复计算的情况下对查询中的推文进行计数?

标签 python twitter twython

我正在开发一个项目,该项目需要计算满足查询参数的推文数量。我正在使用 Python 工作,使用 Twython 作为 Twitter 的界面。

有几个问题,如何记录哪些推文已被统计?您是否会简单地记下最后一条推文 ID,然后忽略它以及之前的所有推文? --最简单的实现是什么?

作为另一个优化问题,我想确保计数器错过的推文数量最少,有什么方法可以确保这一点吗?

非常感谢。

最佳答案

你可以考虑使用套装!它们可以防止重复。

一些伪代码:

s = set()
for tweet in tweets:
   s.add(tweet.id)

关于python - 如何在不重复计算的情况下对查询中的推文进行计数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13261858/

相关文章:

python - twython get_followers_list 只能获取200个关注者

python - TwythonStreamer 重音编码? - 无法解码响应,无效 JSON,代码为 200

python - 枕头滴灌领域用python3.2 django1.8

python - 朴素贝叶斯分类器的 K 折交叉验证

python 请求库不返回任何响应

Twitter 分享 - 将 urlencode 参数 %2C 重定向到 %252C

python - jsonpickle 为 python 对象属性添加前导下划线

javascript - 如何使用我的 Twitter API ID 初始化 Twitter 的 widget.js SDK?

javascript - 在没有 Javascript 的情况下嵌入 Twitter Feed

python - 使用 Twython 获取推文 ID?