python - 在scrapy爬行中使用css选择器提取span之外的文本

标签 python html css-selectors scrapy

我有以下 html 代码:

    <h1>
        <a href="https://www.google.com">
            <span>448587: </span>Brian McMills
        </a>
    </h1>

我只对Brian McMills感兴趣。我想使用 scrapy css 选择器 功能来选择文本。

当我使用 h1 a::text 时,它仅选择 448587: 部分,我尝试了 :not(span) 的一些组合> 但它不起作用。

注意:我对 Xpath脚本 解决方案不感兴趣,只对 css.

最佳答案

唯一有效的是h1 a:not(span)::text

谢谢。

关于python - 在scrapy爬行中使用css选择器提取span之外的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49936127/

相关文章:

python - Pandas:合并和比较数据帧

javascript - 复杂 HTML 的数据表导出(python 变形)

javascript - 如何在按钮点击时显示 iframe

html - 从另一个 css 类继承

独生子女的 CSS 选择器,包括文本

python - 在运行 Yosemite 的 Mac 上完成 PyMySQL 的安装

python - LEFT JOIN python中基于值的字典

javascript - 显示/隐藏 div javascript 触发 div 宽度

javascript - 获取 Canvas 内的鼠标位置

css - 是否有用于文本节点的 CSS 选择器?