我正在使用 Scrapy 库来抓取网页。
但是我有一个问题。我不知道如何定位 data
属性。
我有一个带有 data
属性和 href
的链接,如下所示:
<a data-item-name="detail-page-link" href="this-is-some-link">
我要的是href
的值。如果 a
有类,我可以按如下方式进行:
response.css('.some-class::attr(href)')
但问题是我不知道如何定位 data-item-name
属性。
有什么建议吗?
最佳答案
使用 scrapy css
选择器,你可以:
response.css('a[data-item-name="detail-page-link"]::attr(href)').extract()
关于python - 如何使用 Scrapy 定位数据属性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50734845/