python - 来自 Twitter 的语料库

标签 python twitter

作为一名开发人员,我是 Twitter 的新手。我看到有人可以使用推文的 ID 下载数据集。但是 Twitter API 有下载限制。

有没有更快的方法来做到这一点?

最佳答案

如果您只想抓取用户名的推文,您可以这样做:

import httplib
import json
import urllib2
import pprint

def feed(username, messages=50):
    template = 'https://api.twitter.com/1/statuses/user_timeline.json?' + \
               'include_entities=false&include_rts=true&screen_name=%s&count=%i'
    url    = template % (username, messages)
    output = urllib2.urlopen(url)
    html   = ''.join(output.readlines())
    tweet  = json.loads(html)
    # pprint.pprint(tweet)
    return list(map(lambda t : t['text'], tweet))

result = feed('noelevans', messages=100)

关于python - 来自 Twitter 的语料库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13787122/

相关文章:

python - 在不删除python中的字符的情况下拆分具有不同条件的字符串

python如何替换数组(x,n)中每个x的第一个f(x)值

Twitter API 和转发

android - Cordova 4.1.2 推特整合

ruby-on-rails - 使用 Ruby on Rails Twitter Gem 在 Twitter 上上传多张图片

python - 如何使用 python 删除文本文件中的多行?

python - 在 Python 中使用 NLTK 找韵

python - OpenGL Camera 一直围绕原点旋转

iphone - iPhone应用程序中的Twitter登录

python - 有人可以为 Twitter 状态更新提供一个简单的 Python 示例吗?