python - scrapy : find element which has particular text

标签 python web-scraping scrapy

我正在使用scrapy进行爬行。我正在获取网站的全部内容。

import scrapy
import os

class QuotesSpider(scrapy.Spider):
    name = "team"

    def start_requests(self):
        yield scrapy.Request(url='http://*****.com', callback=self.get_scripts)

    def get_scripts(self, response):
        print response.css("body").extract()

    def get_scripts(self, response):
        print response.css("body").extract()

现在我正在搜索一个文本,我可以通过 python 简单搜索文本/子字符串来获取该文本。我想要的是选择该文本匹配的选择器。请告知执行此操作的最佳方法是什么。

最佳答案

你可以做这样的事情。

response.xpath("//*[contains(text(), 'MY TEXT')]").getall()

它将返回包含MY TEXT的所有项目的列表

关于python - scrapy : find element which has particular text,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42967770/

相关文章:

python - Pygame,旋转图像而无需在每次迭代中加载图像

python - Scipy CSR "vectors"之间更快的 Python 余弦差异

python - 在行 [NumPy 或 Tensorflow] 的索引值之前将行中的值设置为零

python - Scrapy 选择器返回页面上的所有内容而不是相对的

python - 使用 Selenium 从下拉列表中选择后如何从表中获取更新的数据?

python - scrapy 的 yield 逻辑被破坏

python-3.x - Scrapy不进入parse()

python - 如何将 gRPC Python 插件与 Docker 和 Google Cloud Builds 一起使用?

python - 堆叠多个规则 Scrapy 进行深度爬取

Python Scrapy 不断从下一页按钮获取同一页面链接