python - 为什么我用Python做的网络爬虫不能用?

标签 python css

我正在学习由 Digital Ocean 的 Justin Duke 撰写的网络抓取教程。这是教程的链接

https://www.digitalocean.com/community/tutorials/how-to-crawl-a-web-page-with-scrapy-and-python-3

当我运行我的代码时,网络爬虫显示以下错误:

'BrickSetSpider.parse 回调'未定义'。

我不确定这是什么意思。

这是我使用的代码。

import scrapy


class BrickSetSpider(scrapy.Spider):
    name = "brickset_spider"
    start_urls = ['http://brickset.com/sets/year-2016']

def parse(self, response):
        SET_SELECTOR = '.set'
        for brickset in response.css(SET_SELECTOR):

            NAME_SELECTOR = 'h1 ::text'
            yield {
                'name': brickset.css(NAME_SELECTOR).extract_first(),
            }

我也是 Python 的新手。因此,如果您对我的问题的回答能够让新手能够理解,我将不胜感激。

最佳答案

像这样

import scrapy


class BrickSetSpider(scrapy.Spider):
    name = "brickset_spider"
    start_urls = ['http://brickset.com/sets/year-2016']

    def parse(self, response):
        SET_SELECTOR = '.set'

        for brickset in response.css(SET_SELECTOR):
            NAME_SELECTOR = 'h1 ::text'
            yield {
            'name': brickset.css(NAME_SELECTOR).extract_first(),
                  }

关于python - 为什么我用Python做的网络爬虫不能用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56764036/

相关文章:

python - 在 python discordpy 中加载扩展

python - 有没有办法创建带有参数的符号链接(symbolic link)? (Linux)

python - 将字典展开到 DataFrame 中,然后添加到原始 DataFrame 中,并添加新列和复制的原始数据

javascript - 如何在不使用 <input> 的情况下制作带有闪烁光标和可编辑文本的 div?

css - Visual Studio 缩进 CSS 就像 block 永远不会关闭

python - Crontab 没有按预期工作

python - 如何从 Google Cloud Platform 存储下载文件

css - 对准中心 UL/LI 标签

jquery - 单击更改 flash.width

CSS:清除内联元素