python - 通过中国防火墙重定向推特页面

标签 python html email twitter

我的弟弟,现在还住在中国,是迈克尔·菲尔普斯的粉丝。他想查看他的推特帖子。因为他们无法访问 GFW 背后的推特,而且设置 VPN 对我妈妈来说太难了。我想写一些能引起 Twitter 关注的内容,并将它们发送到我妈妈的电子邮箱。

我使用 python 作为我的主要语言。熟悉tweepy/request/scrapy

我已经尝试或考虑过三种方法:

  1. 使用 twitter API 并获取 user_timeline。但是,此方法将丢失所有图形数据并抛出一堆无用的链接,这些链接只有在正确渲染后才可见

  2. 进行网页抓取并保存 html 内容。然后将 html 文件作为附件发送。然而,这种方法仍然会丢失一些图形内容,并且对于 40 多岁的人来说不太友好。此外,很难判断我抓取了多少推文以及是否有任何更新。

  3. 将电子邮件中的 html 内容包装起来,并在电子邮件中使用 html 渲染。我以前没有用过这个,所以我不确定它会如何运作。

我知道“做这件事的最佳方法是什么”这样的问题在 SO 上总是被否决,但我确实相信这个问题足够特殊,可以进行有意义的问答。任何建议将不胜感激。

最佳答案

您是否考虑过使用 selenium 并截取浏览器窗口的屏幕截图?使用 selenium 进行屏幕截图非常简单

browser.get('twitter.com')
browser.get_screenshot_as_file('twitter_screenshot.png')

您必须想出一种方法来自动监视新推文并在发现新推文时运行 selenium 脚本。然而,就保留图形内容而言,使用 Selenium 截取屏幕截图将很容易实现。

文档:http://selenium-python.readthedocs.io/api.html#selenium.webdriver.remote.webdriver.WebDriver.get_screenshot_as_file

关于python - 通过中国防火墙重定向推特页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41841120/

相关文章:

Python "callable"属性(伪属性)

python - 退出 python 上下文管理器时返回值

email - 当电子邮件内容无效或邮件未使用 sendgrid API 在 php 中传递时收到通知

html - 如何设置在 HTML 选择框中显示的最大元素数

php - 基于用户输入的计时器 PHP

c# - 发送电子邮件时出错 system.web.httpexceptions : the message could not be sent to the smtp server

c# - 在 c# 中从数据表发送带有 excel 作为附件的电子邮件

python - Wapiti 安全工具 : Getting "Invalid Syntax Error "

python - Pandas 匹配多列并将匹配值作为单个新列获取

javascript - 通过从 html 中提取图像来创建图像数组