api - 我应该使用哪个 Twitter API 来提取大量推文用于 NLP 研究?

标签 api twitter nlp

我想尽可能多地提取包含给定关键字(通常是公司名称)的推文。

我一直在使用 Twitter 搜索 API,但它仅限于“最近的推文”。因此,对于一个相对罕见的关键字,我最多只能获得 500 条推文。

Twitter 说您不应该使用搜索 API 进行研究。那么,我应该使用哪个 API?

最佳答案

要获取大量带有特定关键字的推文,请使用 Streaming APIStatuses/Filter .

首先,创建一个包含 track 条款的文件(例如“tracking.txt”) , 关键字以逗号分隔。这可以包括散列标签。例如,我使用以下方法获取带有链接和特定主题标签的推文。

track=http #baby,http #family,http #children, ...

然后,使用 curl 将流重定向到文件。确保使用您的推特 ID 和密码。

curl -d @tracking.txt https://stream.twitter.com/1/statuses/filter.json -uAnyTwitterUser:Password > stream.json

关于api - 我应该使用哪个 Twitter API 来提取大量推文用于 NLP 研究?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9893150/

相关文章:

node.js - 删除 API 不起作用

api - 在 Google Analytics(分析)用户事件报告 API 中,JSON 响应中 1 的采样大小是什么意思?

ios - 在 iOS 中处理 Twitter 错误消息

objective-c - 停止 TWTweetComposeViewController 在设备锁定时自动取消

text - 在自然语言处理(NLP)中,如何进行有效的降维?

java - SpringBoot Catalina生命周期异常

api - Slim 框架和 GET/PUT/POST 方法

javascript - 如果动态附加,为什么 Twitter 推文按钮不起作用?

python - 如何去除标点符号?

python - 位于tensorflow.org 的tensorflow 示例中的官方模块