我有以下 HTML 结构
我想用 class:dev-link
<a class="dev-link" href="mailto:info@jourist.com" rel="nofollow" title='Photoshoot"</a>
我正在使用下面的代码在 scrapy 中提取链接
response.css('.dev-link::attr(href)').extract()
我得到了正确的输出,但这是使用 css 选择器的正确方法吗??
最佳答案
正如您在 Scrapy Documentation 中看到的那样有两种废弃数据的方法,CSS Selector 和 XPath Selector 都可以正常工作,但是 XPath 需要一些练习才能成为专家,在我看来,Xpath 在特殊方面更强大在某些情况下,您可以比 CSS 选择器更容易地抓取数据(当然您也可以使用 CSS 选择器获取它们),
你做的是对的
link = response.css('.dev-link::attr(href)').extract_first()
你也可以通过下面的方式获取它
link = response.xpath('/[contains(@class,’dev-link’)]/@href').extract_first()
关于python - 使用 css 选择器提取具有特定类的链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48448900/