python - 从页面获取特定图像

标签 python html web-scraping beautifulsoup html-parsing

我对 BeautifulSoup 还很陌生。我正在尝试打印来自 http://www.bing.com/images?q=owl 的图像链接:

redditFile = urllib2.urlopen("http://www.bing.com/images?q=owl")
redditHtml = redditFile.read()
redditFile.close()

soup = BeautifulSoup(redditHtml)

productDivs = soup.findAll('div', attrs={'class' : 'dg_u'})
for div in productDivs:
    print div.find('a')['t1']  #works fine
    print div.find('img')['src'] #This getting issue KeyError: 'src'

但这仅给出标题，而不给出图像源有什么问题吗？

编辑: 我已经编辑了我的源，仍然无法获取图像网址。

最佳答案

Bing 正在使用一些技术来阻止自动抓取工具。我尝试打印

div.find('img')

发现他们正在属性名称 src2 中发送源代码，因此以下应该可以工作 -

div.find('img')['src2']

这对我有用。希望对您有所帮助。

关于python - 从页面获取特定图像，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30731895/

上一篇：html - 带有图像和文本的链接 - 组合还是单独？

下一篇：javascript - 使用 jQuery 循环悬停 : go next then pause

相关文章：

python - Pandas 日期时间索引的算术运算

python - 如何按特定项目切割 list ？

html - 无法更改子导航栏的高度

html - CSS 弹出菜单

rvest::html_nodes 返回部分列表(仅少数项目)

javascript - 导航到 URL 但未收到响应

python - 如何使用 web3.py 在钱包之间传输 ERC20 代币

java - 免费的 Java HTML 和 JS 解析器

python - 如何提取不在标签内的 2 个不同的封闭 html 标签之间的文本？

python - 获取sklearn中节点的决策路径

©2024 IT工具网联系我们