我目前正在使用 r v. 1.0.44 和包 twitteR(最新版本)抓取基于某些关键字的推文。具体来说,我使用以下命令:
my_twitter_data <- searchTwitter("#aleppo", n = 40000, lang = "en", since = '2016-12-12', until = "2016-12-13", retryOnRateLimit = 120)
在请求关于#aleppo 的 40k 推文(由于速率限制,这需要相当长的时间才能获得),只有 5k 结果将是原始推文,即 strip_retweets(my_twitter_data, strip_manual=TRUE, strip_mt=TRUE )
将返回一个长度为 5k 的列表。
我的问题是我花费了大量的速率限制,因此时间都花在了与我的进一步分析无关的转推上。我的问题是在 R 中是否有解决这个问题的方法,所以我只将我的速率限制用于原始推文?
最佳答案
您可以将 -filter:retweets
添加到您的查询中:
my_twitter_data <- searchTwitter("#aleppo -filter:retweets", n = 40000,
lang = "en", since = '2016-12-12',
until = "2016-12-13", retryOnRateLimit = 120)
关于r - 在 r 中使用 twitteR 排除抓取转推,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41164121/