scrapy - 如何通过scrapy获取 'img' src属性？

我想使用scrapy来获取img的链接，所以我在scrapy的履带式程序中编写以下程序:

hxs.select('//dl[@class="clearfix"]//img/@src/text()').extract()

但是，无论如何它是行不通的。有什么问题吗？

最佳答案

text()是元素的文本。只需使用@src:

hxs.select('//dl[@class="clearfix"]//img/@src').extract()

关于scrapy - 如何通过scrapy获取 'img' src属性？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16127692/

相关文章：

python - 阿拉伯字母上的 Scrapy 返回一些奇怪的东西