scrapy - 如何通过scrapy获取 'img' src属性?

标签 scrapy

我想使用scrapy来获取img的链接,所以我在scrapy的履带式程序中编写以下程序:

hxs.select('//dl[@class="clearfix"]//img/@src/text()').extract()

但是,无论如何它是行不通的。有什么问题吗 ?

最佳答案

text()是元素的文本。只需使用@src:

hxs.select('//dl[@class="clearfix"]//img/@src').extract()

关于scrapy - 如何通过scrapy获取 'img' src属性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16127692/

相关文章:

python - 阿拉伯字母上的 Scrapy 返回一些奇怪的东西

python - 如何使用 py2exe 将我的 scrapy spider 构建为 exe 文件?

python - 无法使用scrapy获取HTML表格中的行数

python - 将 Scrapy 的输出格式化为 XML

python - 在 scrapy 框架 python 中解析 JSON 响应的最佳方法

python - 爬虫将数据更新到数组,在循环内yield

python - 爬虫进程意外死亡

web-scraping - 如何根据亚马逊的位置抓取数据?

python-2.7 - 如何解决scrapy中的403错误

python - 使用带有身份验证的 scrapy 旋转代理