r - 在 r 中使用 twitteR 排除抓取转推

我目前正在使用 r v. 1.0.44 和包 twitteR(最新版本)抓取基于某些关键字的推文。具体来说，我使用以下命令:

 my_twitter_data  <- searchTwitter("#aleppo", n = 40000, lang = "en", since =    '2016-12-12', until = "2016-12-13", retryOnRateLimit = 120)

在请求关于#aleppo 的 40k 推文(由于速率限制，这需要相当长的时间才能获得)，只有 5k 结果将是原始推文，即 strip_retweets(my_twitter_data, strip_manual=TRUE, strip_mt=TRUE ) 将返回一个长度为 5k 的列表。

我的问题是我花费了大量的速率限制，因此时间都花在了与我的进一步分析无关的转推上。我的问题是在 R 中是否有解决这个问题的方法，所以我只将我的速率限制用于原始推文？

最佳答案

您可以将 -filter:retweets 添加到您的查询中:

 my_twitter_data <- searchTwitter("#aleppo -filter:retweets", n = 40000,
                                  lang = "en", since = '2016-12-12',
                                  until = "2016-12-13", retryOnRateLimit = 120)

关于r - 在 r 中使用 twitteR 排除抓取转推，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41164121/

上一篇：salt-stack - 如何在 saltstack 中渲染 sls 支柱文件？

下一篇：stored-procedures - RPGLE 程序/过程中的原型(prototype)和界面

相关文章：

R block 代码留在 Beamer 框架内

r - 在 R 中自定义 make.names 函数？

php - 是否有一个 PHP API 可以发布到多个共享站点(Twitter、Reddit、Linkedin 等)？

python - 如何使用 Scrapy 抓取新链接

c# - 延迟后屏幕抓取网页

r - 基于另一个数据框更改数据框的值

r - 如何对每个样本的多个观察值中的变量进行分箱？

api - Twitter 语言代码 "in"

jquery - 当我使用 jQuery 注入(inject) Tweet 按钮时，为什么 Chrome 会生成警告？

python - 在 Python 中重新排列解析的 HTML 数据