python - 使用 Python 从电子邮件中提取 URL

标签 python email url

感谢您向 ourdirectory.com 提交内容 网址:http://myurlok.us 请点击下面的链接确认您的提交。 http://www.ourdirectory.com/confirm.aspx?id=1247778154270076

Once we receive your comfirmation, your site will be included for process!
regards,

http://www.ourdirectory.com

Thank you!

应该很明显我需要提取哪个 URL。

最佳答案

如果是带有超链接的 HTML 电子邮件,您可以使用 HTMLParse 库作为快捷方式。

import HTMLParser
class parseLinks(HTMLParser.HTMLParser):
    def handle_starttag(self, tag, attrs):
        if tag == 'a':
            for name, value in attrs:
                if name == 'href':
                    print value
                    print self.get_starttag_text()

someHtmlContainingLinks = ""
linkParser = parseLinks()
linkParser.feed(someHtmlContainingLinks)

关于python - 使用 Python 从电子邮件中提取 URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1792366/

相关文章:

javascript - JMeter - 在电子邮件标题中发送 HTTP 请求名称

c# - 从 SMTP 服务器发送邮件

c# - C# 中的 url 构建

javascript - tvOS 不加载外部 TVML 文件

vba - 如何检查邮件是否具有有效的数字签名?

.htaccess重写将目录转换成/key/value/key/value

python - Scikit 学习混淆矩阵总是看起来几乎一样

python - SQLAlchemy 查询返回 None

python - 批量或 python 备份/复制整个文件夹树?

python - 列表理解和 % 函数