python - 如何使用 Scrapy 定位数据属性

标签 python scrapy

我正在使用 Scrapy 库来抓取网页。

但是我有一个问题。我不知道如何定位 data 属性。

我有一个带有 data 属性和 href 的链接,如下所示:

<a data-item-name="detail-page-link" href="this-is-some-link">

我要的是href的值。如果 a 有类,我可以按如下方式进行:

response.css('.some-class::attr(href)') 

但问题是我不知道如何定位 data-item-name 属性。

有什么建议吗?

最佳答案

使用 scrapy css 选择器,你可以:

response.css('a[data-item-name="detail-page-link"]::attr(href)').extract() 

关于python - 如何使用 Scrapy 定位数据属性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50734845/

相关文章:

python - Pandas Dataframe 只返回第一行 JSON 数据

javascript - 编剧自动滚动到无限滚动页面底部

python - Scrapy:从网站上抓取所有文本,但不抓取超链接的文本

html - 如何使用 XPath 选择非空段落?

python - 类型错误 : Object of type 'bytes' is not JSON serializable

redirect - 重定向请求的回调 Scrapy

python - Django,测试重定向到外部页面

python - 安装python包以纠正anaconda环境

python - 有条件地乘法列表python

xpath - Scrapy:如何获得正确的选择器