我想尽可能多地提取包含给定关键字(通常是公司名称)的推文。
我一直在使用 Twitter 搜索 API,但它仅限于“最近的推文”。因此,对于一个相对罕见的关键字,我最多只能获得 500 条推文。
Twitter 说您不应该使用搜索 API 进行研究。那么,我应该使用哪个 API?
最佳答案
要获取大量带有特定关键字的推文,请使用 Streaming API与 Statuses/Filter .
首先,创建一个包含 track 条款的文件(例如“tracking.txt”) , 关键字以逗号分隔。这可以包括散列标签。例如,我使用以下方法获取带有链接和特定主题标签的推文。
track=http #baby,http #family,http #children, ...
然后,使用 curl 将流重定向到文件。确保使用您的推特 ID 和密码。
curl -d @tracking.txt https://stream.twitter.com/1/statuses/filter.json -uAnyTwitterUser:Password > stream.json
关于api - 我应该使用哪个 Twitter API 来提取大量推文用于 NLP 研究?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9893150/