python - 使用python访问网页内容

标签 python python-2.7

我正在尝试访问和操作网页的数据。 出于主要测试目的,我使用了 w3schools 网站,但我无法使用以下代码访问内容:

import urllib as url
import xml.etree.ElementTree as et

web_data = url.urlopen("www.w3schools.com/xml/cd_catalog.xml")
str_data = web_data.read()
print str_data

这些是我遇到的错误:

Traceback (most recent call last):
  File "C:\Python27\webpage.htlm.py", line 4, in <module>
    web_data = url.urlopen("www.w3schools.com/xml/cd_catalog.xml")
  File "C:\Python27\lib\urllib.py", line 87, in urlopen
    return opener.open(url)
  File "C:\Python27\lib\urllib.py", line 213, in open
    return getattr(self, name)(url)
  File "C:\Python27\lib\urllib.py", line 469, in open_file
    return self.open_local_file(url)
  File "C:\Python27\lib\urllib.py", line 483, in open_local_file
    raise IOError(e.errno, e.strerror, e.filename)
IOError: [Errno 2] The system cannot find the path specified: 'www.w3schools.com\\xml\\cd_catalog.xml'

最佳答案

URL 以协议(protocol)开头。

在这里,您可能需要 http://www.w3schools.com/xml/cd_catalog.xml

关于python - 使用python访问网页内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31721689/

相关文章:

python - 我如何在Python中手动管理内存?

python - 如何打印生成器对象的产生值?

python - 在python中递归调用实例方法

python - 使用 gdb.value 更改 GDB 中的结构字段

Python 3 - 类型错误 : 'map' object is not subscriptable

python - 如何解决 GitLab CI/CD 作业中的 "remote: You are not allowed to upload code."错误?

python - 如何使IDLE窗口更具可读性?字体太小我看不清

python - 一种基于pandas条件过滤部分数据的解决方案

python - cv2、cv、mahotas 和 SimpleCV 之间的图像转换

python - 将 XPath 与 Scrapy 结合使用