python - 如何使用 python 保存乌尔都语推文并保存在 csv 文件中

标签 python twitter

我只想以乌尔都语保存推文文本,现在一切正常,推文以 csv 格式保存,我只需要在保存为 csv 文件时清理数据

推文文本以此格式保存

@hinaparvezbutt 贾纳帕韦兹巴特详情请参阅 t.co/GyOeDqydIG.com

我只需要像这样保存文本

加拉加拉加拉加拉加拉加拉加拉加拉加拉加拉加拉加拉加拉加拉加拉加拉加拉加拉加拉加拉加拉ㄧㄧㄧㄧㄥㄥㄥ

虽然我使用正则表达式来清理文本,但我未能将其保存在推文数组中

这是我的代码

auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
# set access token and secret
auth.set_access_token(access_token, access_secret)
# create tweepy API object to fetch tweets
api = tweepy.API(auth,wait_on_rate_limit=True)
tweets = []
for tweet in tweepy.Cursor(api.search,q="اردو"+" -filter:retweets",count=1000).items(1000):
    text=re.sub(r"[#.A-Za-z0-9@;:/\n]", "", tweet.text, flags=re.UNICODE)  
    tweets.append(tweet)
tweets_df = pd.DataFrame(vars(tweets[i]) for i in range(len(tweets)))
FILE_PATH = "mysample.csv"
tweets_df.to_csv(FILE_PATH)
tweet_atts = [
'text', 'created_at', 'favorite_count',
'lang', 'retweet_count', 'source',
'in_reply_to_user_id_str', 'retweeted',
'id'
]
tweets_df = tweets_df[tweet_atts]
tweets_df.to_csv(FILE_PATH)

最佳答案

在每条推文的字典中,都有一个键“lang”。按 lang = 'ur' 过滤。

# import and authentication
import tweepy
from tweepy import OAuthHandler
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_secret)

# API object allows to make calls to Twitter API
api = tweepy.API(auth)

# Owner's timeline tweets
api.home_timeline()

tweets = []
# tweepy.Cursor allows to iterate through objects (for example, tweets)
for status in tweepy.Cursor(api.home_timeline).items(1):
    if (status.lang = 'ur'):
        # print(status.text) 
        tweets.append(status)

关于python - 如何使用 python 保存乌尔都语推文并保存在 csv 文件中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53157549/

相关文章:

Python Cassandra float 精度损失

python - 将 PIL 图像转换为 OpenCV2 图像

javascript - 在 Node 中配置 Twitter Passport 以允许经过身份验证的用户发布推文

ruby-on-rails - 如何通过 gem OmniAuth Facebook/Twitter 注销社交网站

python - NLTK 和停用词失败 #lookuperror

python - 用 Pandas 条形图上的值注释条形图

python - Google Cloud PubSub 在异步拉取消息时抛出 504 Deadline Exceeded 错误

php - 通过 PHP 从 Twitter 解码 JSON 提要不起作用?

python - 对象没有属性 'count'

facebook - 如何使用黑莓 API 访问 facebook 或 twitter?