html - <div> 之后的 Scrapy 抓取文本

标签 html css scrapy web-crawler

我想用Scrapy爬取如下HTML代码:

<td class="xyz"> 
   <div>Irrelevant</div>
   I want to get this text! 
</td>

如何提取该文本？

response.css('td.xyz::text').extract()

返回 ' '

最佳答案

无论是否存在额外的div，您都可以这样做来获取您想要的文本

response.css('td.xyz::text').extract()[-1]

关于html - <div> 之后的 Scrapy 抓取文本，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50317227/

上一篇：html - 文本位于移动 View 的第一部分下方

下一篇：html - @media 规则为我的页面添加了额外的空间

相关文章：

html - 无法让我的网站 Logo 与汉堡包图标出现在同一行

html - innerText 和 outerText 有什么区别？

javascript - 如何在 svg 中设置确切的宽度

javascript - 如何仅更改 1 行而非全部的切换值

python - Scrapy - 理解 CrawlSpider 和 LinkExtractor

php - 从代码库中删除无用文件

javascript - 如何为数组中的每个对象添加 fadeIn() 方法

jquery - 当我的页面顶部出现弹出窗口时，然后使用滚动键，页面滚动，但弹出窗口不滚动

css - Scrapy/xpath 不工作 - 仅适用于 css

python - 如何在 MySQL 数据库中存储动态 python 字典？

©2024 IT工具网联系我们