python - 如何在不重复计算的情况下对查询中的推文进行计数？

我正在开发一个项目，该项目需要计算满足查询参数的推文数量。我正在使用 Python 工作，使用 Twython 作为 Twitter 的界面。

有几个问题，如何记录哪些推文已被统计？您是否会简单地记下最后一条推文 ID，然后忽略它以及之前的所有推文？ --最简单的实现是什么？

作为另一个优化问题，我想确保计数器错过的推文数量最少，有什么方法可以确保这一点吗？

非常感谢。

最佳答案

你可以考虑使用套装!它们可以防止重复。

一些伪代码:

s = set()
for tweet in tweets:
   s.add(tweet.id)

关于python - 如何在不重复计算的情况下对查询中的推文进行计数？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13261858/