python - 如何使用Python从<image/>获取src属性

标签 python web-scraping beautifulsoup

我正在从一个网站抓取数据,并且需要找到一张图片。 我明白了,但输出不是我需要的。

我尝试过在线寻找解决方案,更改代码,但没有任何效果。

r = requests.get(baseurl)
content = r.content
soup = BeautifulSoup(content, "html.parser")

images = soup.findAll('img')[1]
print(images)

我得到的输出:

<img src="https://cdn.rubyrealms.com/images/WKpivrdGBJJ9p6etIY2aJpixikFj4vnpmpPR9pXjK4Y8K.png" style="border-radius: 5px"/>

我需要的输出:

cdn.rubyrealms.com/images/WKpivrdGBJJ9p6etIY2aJpixikFj4vnpmpPR9pXjK4Y8K.png

(我尝试打印(images.text))

最佳答案

您可以使用;获取img标签的src内容

images = soup.findAll('img')[1]
print(images.get("src"))

images = soup.findAll('img')[1]
print(images['src'])

输出

https://cdn.rubyrealms.com/images/WKpivrdGBJJ9p6etIY2aJpixikFj4vnpmpPR9pXjK4Y8K.png

print(images.text) 的问题是它用于提取两个标签之间的文本,而您想要提取标签本身内部的文本。

希望这对你有帮助:)

关于python - 如何使用Python从<image/>获取src属性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56943210/

相关文章:

Python 子进程模块 : "Could not make directory"

python - 根据列表列表检查列表中组合的存在

python:如何拥有一个属性和一个setter函数来检测值发生的所有变化

python - Scrapy:如何提取 HTML 标签内的所有单词?

python - 我正在尝试使用 beautifulsoup 从 craigslist 中提取一些链接,但它拉动链接 100 次而不是一次

python - 如何通过 dev_appserver.py 在 Google App Engine 上使用 BeautifulSoup 和 lxml

python - 从 html 文件的元素中提取信息

python - 如何使用 Superfeedr 订阅实时 XMPP RSS 提要

python - 将 Scrapy 与 Javascript 和 iFrame 及替代品一起使用

python - 重新编译正则表达式帮助(python、beautifulsoup)