我想用Scrapy爬取如下HTML代码:
<td class="xyz">
<div>Irrelevant</div>
I want to get this text!
</td>
如何提取该文本?
response.css('td.xyz::text').extract()
返回 ' '
最佳答案
无论是否存在额外的div
,您都可以这样做来获取您想要的文本
response.css('td.xyz::text').extract()[-1]
关于html - <div> 之后的 Scrapy 抓取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50317227/