python - 如何将数据传递到scrapinghub?

标签 python scrapy scrapinghub

我正在尝试在 scrapinghub 上运行 scrapy 蜘蛛,并且我想传递一些数据。我正在使用他们的 API 来运行蜘蛛:

http://doc.scrapinghub.com/api/jobs.html#jobs-run-json

他们有一个 job_settings 选项,这似乎相关,但我不知道如何访问我的 Spider 中的 job_settings 数据> 类。这里正确的做法是什么?

最佳答案

job_settings应直接合并到Scrapy settings ,具有更高的优先级(40,IIRC)。

Scrapy 设置可以通过蜘蛛实例的 .settings 属性访问,例如如果 selfscrapy.Spider 实例,则可以使用 self.settings

关于python - 如何将数据传递到scrapinghub?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39260455/

相关文章:

python - 剥离功能不起作用。如何解决问题?

python - mysql.connector.errors.InterfaceError : 2003: Can't connect to MySQL server on '127.0.0.1:3306' on Scrapinghub

google-cloud-platform - 无法创建数据流模板,因为 Scrapinghub 客户端库不接受 ValueProvider

python - 并行执行具有不同参数的相同 Python 程序

python - 单元测试 Flask 应用程序时的模板

python - 为什么需要为 Python 设置环境变量才能使 Scrapy 工作?

Python scrapy,如何在单个蜘蛛中的每个请求之间进行随机延迟?

python - Scrapinghub 在信号处理程序 : <bound method ? 上捕获错误

python - 分发 .pyc 文件有什么限制?

python - 返回 if 条件内部