python - 使用 urllib.urlopen() 无法获得网页的源代码

标签 python beautifulsoup urllib2

我正在尝试从 'https://www.youtube.com/trendsdashboard#loc0=ind' 获取视频链接。当我检查元素时,它会显示每个视频的源 html 代码。在使用

检索的源代码中
urllib2.urlopen("https://www.youtube.com/trendsdashboard#loc0=ind").read()

它不显示视频的 html 源代码。还有其他办法吗?

<a href="/watch?v=dCdvyFkctOo" alt="Flipkart Wish Chain">
        <img src="//i.ytimg.com/vi/dCdvyFkctOo/hqdefault.jpg" alt="Flipkart Wish Chain">
      </a>

当我们从浏览器检查元素时会出现这个简单的代码,但不会出现在 urllib 获取的源代码中

最佳答案

查看源代码需要使用read方法 如果你只是使用 open 它会给你这样的东西。

In [12]: urllib2.urlopen('https://www.youtube.com/trendsdashboard#loc0=ind')
Out[12]: <addinfourl at 3054207052L whose fp = <socket._fileobject object at 0xb60a6f2c>>

要查看源代码,请使用 read

urllib2.urlopen('https://www.youtube.com/trendsdashboard#loc0=ind').read()

关于python - 使用 urllib.urlopen() 无法获得网页的源代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30772634/

相关文章:

python - 读取行并循环文件对象

python - Django:Python 全局变量重叠,即使是单独运行

python - 使用 scrapy 进行网页抓取时的字符编码问题

java - 从网页抓取时,html 与我检查元素时的不一样?

python - Google appengine 是否缓存外部请求?

python - 使用 urllib 登录网站

Python:在列表中嵌入的字典中搜索

python - BeautifulSoup:获取类文本

python - 将 find_all 漂亮的汤标签组合成一个字符串

Python - 如何获取特定 div 的样式属性总数