html - <div> 之后的 Scrapy 抓取文本

标签 html css scrapy web-crawler

我想用Scrapy爬取如下HTML代码:

<td class="xyz"> 
   <div>Irrelevant</div>
   I want to get this text! 
</td>

如何提取该文本?

response.css('td.xyz::text').extract()

返回 ' '

最佳答案

无论是否存在额外的div,您都可以这样做来获取您想要的文本

response.css('td.xyz::text').extract()[-1]

关于html - <div> 之后的 Scrapy 抓取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50317227/

相关文章:

html - 无法让我的网站 Logo 与汉堡包图标出现在同一行

html - innerText 和 outerText 有什么区别?

javascript - 如何在 svg 中设置确切的宽度

javascript - 如何仅更改 1 行而非全部的切换值

python - Scrapy - 理解 CrawlSpider 和 LinkExtractor

php - 从代码库中删除无用文件

javascript - 如何为数组中的每个对象添加 fadeIn() 方法

jquery - 当我的页面顶部出现弹出窗口时,然后使用滚动键,页面滚动,但弹出窗口不滚动

css - Scrapy/xpath 不工作 - 仅适用于 css

python - 如何在 MySQL 数据库中存储动态 python 字典?