我的弟弟,现在还住在中国,是迈克尔·菲尔普斯的粉丝。他想查看他的推特帖子。因为他们无法访问 GFW 背后的推特,而且设置 VPN 对我妈妈来说太难了。我想写一些能引起 Twitter 关注的内容,并将它们发送到我妈妈的电子邮箱。
我使用 python 作为我的主要语言。熟悉tweepy/request/scrapy
我已经尝试或考虑过三种方法:
使用 twitter API 并获取
user_timeline
。但是,此方法将丢失所有图形数据并抛出一堆无用的链接,这些链接只有在正确渲染后才可见进行网页抓取并保存 html 内容。然后将 html 文件作为附件发送。然而,这种方法仍然会丢失一些图形内容,并且对于 40 多岁的人来说不太友好。此外,很难判断我抓取了多少推文以及是否有任何更新。
将电子邮件中的 html 内容包装起来,并在电子邮件中使用 html 渲染。我以前没有用过这个,所以我不确定它会如何运作。
我知道“做这件事的最佳方法是什么”这样的问题在 SO 上总是被否决,但我确实相信这个问题足够特殊,可以进行有意义的问答。任何建议将不胜感激。
最佳答案
您是否考虑过使用 selenium 并截取浏览器窗口的屏幕截图?使用 selenium 进行屏幕截图非常简单
browser.get('twitter.com')
browser.get_screenshot_as_file('twitter_screenshot.png')
您必须想出一种方法来自动监视新推文并在发现新推文时运行 selenium 脚本。然而,就保留图形内容而言,使用 Selenium 截取屏幕截图将很容易实现。
关于python - 通过中国防火墙重定向推特页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41841120/