python - 值错误 : unknown url type

标签 python parsing urllib2 urllib traceback

标题几乎说明了一切。这是我的代码:

from urllib2 import urlopen as getpage
print = getpage("www.radioreference.com/apps/audio/?ctid=5586")

这是我得到的回溯错误:

Traceback (most recent call last):
  File "C:/Users/**/Dropbox/Dev/ComServ/citetest.py", line 2, in <module>
    contents = getpage("www.radioreference.com/apps/audio/?ctid=5586")
  File "C:\Python25\lib\urllib2.py", line 121, in urlopen
    return _opener.open(url, data)
  File "C:\Python25\lib\urllib2.py", line 366, in open
    protocol = req.get_type()
  File "C:\Python25\lib\urllib2.py", line 241, in get_type
    raise ValueError, "unknown url type: %s" % self.__original
ValueError: unknown url type: www.radioreference.com/apps/audio/?ctid=5586

我最好的猜测是 urllib 无法从不整洁的 php URL 中检索数据。如果是这种情况,是否有解决方法?如果不是,我做错了什么?

最佳答案

您应该首先尝试在 url 前添加 'http://'。此外,不要将结果存储在print 中,因为它会将引用绑定(bind)到另一个(不可调用的)对象.

所以这一行应该是:

page_contents = getpage("http://www.radioreference.com/apps/audio/?ctid=5586")

这会返回一个类似对象的文件。要阅读其内容,您需要使用不同的文件操作方法,如下所示:

for line in page_contents.readlines():
    print line

关于python - 值错误 : unknown url type,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13641792/

相关文章:

python - 使用字典进行字符串压缩

Python 列表理解

使用 Mechanize 的 Python 自动登录

python - 使用 urllib3 进行多部分表单编码和发布

python - 如何使用 python 将 "send"数据(图像)发送到 ImageBam.com

python - 了解将密集层连接到 LSTM

python - 如何删除字符串中第一次出现的字符之后的每次出现

parsing - 将中文转换为拼音

Python JSON 提取

python - Python数据解析中的正则表达式