python - 在scrapy爬行中使用css选择器提取span之外的文本

我有以下 html 代码:

    <h1>
        <a href="https://www.google.com">
            <span>448587: </span>Brian McMills
        </a>
    </h1>

我只对Brian McMills感兴趣。我想使用 scrapy css 选择器 功能来选择文本。

当我使用 h1 a::text 时，它仅选择 448587: 部分，我尝试了 :not(span) 的一些组合> 但它不起作用。

注意:我对 Xpath 或 脚本 解决方案不感兴趣，只对 css.

最佳答案

唯一有效的是h1 a:not(span)::text。

谢谢。

关于python - 在scrapy爬行中使用css选择器提取span之外的文本，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49936127/

相关文章：

python - Pandas:合并和比较数据帧