我有以下 html 代码:
<h1>
<a href="https://www.google.com">
<span>448587: </span>Brian McMills
</a>
</h1>
我只对Brian McMills
感兴趣。我想使用 scrapy css 选择器
功能来选择文本。
当我使用 h1 a::text
时,它仅选择 448587:
部分,我尝试了 :not(span)
的一些组合> 但它不起作用。
注意:我对 Xpath
或 脚本
解决方案不感兴趣,只对 css
.
最佳答案
唯一有效的是h1 a:not(span)::text
。
谢谢。
关于python - 在scrapy爬行中使用css选择器提取span之外的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49936127/