python - 我应该使用哪个类来抓取图像链接?我正在使用 scrapy 和 spider lib

标签 python web-scraping scrapy

这是我写的代码。所有项目都有效接受产品图片链接

product_name = response.css('.product__name::text').extract()
    product_category = response.css('.product__group::text').extract()
    product_rarity = response.css('.product__extended-field::text').extract()
    product_imagelink = response.css('.product__details .product__image .img::attr(src)').extract()
    product_price = response.css('dd::text').extract()

最佳答案

您的问题是不应该有 .在 img 之前,因为它是类型选择器而不是类

product_imagelink = response.css('.product__details .product__image img::attr(src)').extract()

你可以缩短为

product_imagelink = response.css('.product__image img::attr(src)').extract()

关于python - 我应该使用哪个类来抓取图像链接?我正在使用 scrapy 和 spider lib,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57859653/

相关文章:

python - 使用 getPageSource 检查网页上是否存在某些文本。我得到错误对象没有属性 getPageSource

python - 为什么 python 不允许我删除文件?

python - 设置子模块依赖

python - 使用 python 和 sqlite 进行网页抓取。如何有效存储爬取的数据?

python - 安装Scrapy时出错: path not specified

python - Django Selenium 单击 ajax 模式弹出窗口上的按钮

javascript - CasperJS 按类获取元素的 innerHTML

python - 需要使用python清理网络抓取的数据

python - Scrapy 检索文本编码不正确,希伯来语为\u0d5 等

python - 将 scrapy 与 selenium 结合使用用于动态页面