python - 转换短网址

标签 python web web-scraping

刚接触 Python(和编程)两天的新手,所以请保持温和。

我从 Twitter 上收集了大约 1500 个缩短的 URL。它们都采用以下格式:http://t.co/ ...

使用它来扩展短网址:

import urllib2  
a = urllib2.urlopen('http://t.co/..')  
print a.url

最后两行使用不同的 URL 重复了大约 1500 次。

只要 URL 指向的页面存在,它就可以正常工作,但是如果它不存在,则会出现错误消息并在该点停止。我应该向代码添加什么,以便它返回“找不到页面”并继续到下一个 URL 并不停地遍历整个列表。

最佳答案

假设您使用的是 python 2(python 3 具有稍微不同的异常处理语法)

for url in urls:
    try:
        a = urllib2.urlopen(url)  
    except urllib2.HTTPError, e:
        print "Error", e
        continue

..... do something with a   

关于python - 转换短网址,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14961859/

相关文章:

python - 尝试使用 groupby 查找每月 5 个最大值

python - numpy 数组列出转换问题

python - 打开openpyxl保存的工作簿时Excel有不可读的内容

javascript - 使用带有 2 个滚动条的 Scrollspy

Angularjs ui-router 阻止访问非状态路由

javascript - 对同一域发出 CORS 错误的获取请求

excel - 无法以自定义方式在 excel 文件中写入数据

jquery - 如何使用 VBA 单击基于 Java 的 Web 按钮?

python - 使用 python 多处理时,mysql 得到不同的结果

excel - 将 Web 浏览器自动化转换为 XmlHTTP 请求