我正在开发一个项目,该项目需要计算满足查询参数的推文数量。我正在使用 Python 工作,使用 Twython 作为 Twitter 的界面。
有几个问题,如何记录哪些推文已被统计?您是否会简单地记下最后一条推文 ID,然后忽略它以及之前的所有推文? --最简单的实现是什么?
作为另一个优化问题,我想确保计数器错过的推文数量最少,有什么方法可以确保这一点吗?
非常感谢。
最佳答案
你可以考虑使用套装!它们可以防止重复。
一些伪代码:
s = set()
for tweet in tweets:
s.add(tweet.id)
关于python - 如何在不重复计算的情况下对查询中的推文进行计数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13261858/