我正在从一个网站抓取数据,并且需要找到一张图片。 我明白了,但输出不是我需要的。
我尝试过在线寻找解决方案,更改代码,但没有任何效果。
r = requests.get(baseurl)
content = r.content
soup = BeautifulSoup(content, "html.parser")
images = soup.findAll('img')[1]
print(images)
我得到的输出:
<img src="https://cdn.rubyrealms.com/images/WKpivrdGBJJ9p6etIY2aJpixikFj4vnpmpPR9pXjK4Y8K.png" style="border-radius: 5px"/>
我需要的输出:
cdn.rubyrealms.com/images/WKpivrdGBJJ9p6etIY2aJpixikFj4vnpmpPR9pXjK4Y8K.png
(我尝试打印(images.text))
最佳答案
您可以使用;获取img
标签的src
内容
images = soup.findAll('img')[1]
print(images.get("src"))
或
images = soup.findAll('img')[1]
print(images['src'])
输出
https://cdn.rubyrealms.com/images/WKpivrdGBJJ9p6etIY2aJpixikFj4vnpmpPR9pXjK4Y8K.png
print(images.text)
的问题是它用于提取两个标签之间的文本,而您想要提取标签本身内部的文本。
希望这对你有帮助:)
关于python - 如何使用Python从<image/>获取src属性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56943210/