python - 运行时更新 scrapy 蜘蛛

标签 python web-scraping scrapy

我正在使用 python scrapy 包。有没有办法在蜘蛛运行时更新 scrapy 蜘蛛设置?我尝试了 telnet 控制台并通过以下方式更新设置:

settings.set('AUTOTHROTTLE_ENABLED', False)

当我启动蜘蛛时,“AUTOTHROTTLE_ENABLED”为 True。然而,执行上述命令后,蜘蛛的行为并没有改变。我错过了什么?谢谢!

最佳答案

Scrapy 设置在引擎启动时加载,并且无法即时更改。

我不确定您想要实现什么目标,但您应该考虑调整 download_delay spider attribute在飞行中。

此外,调查 autothrottle extension source code可以帮助您想出更多选择。

关于python - 运行时更新 scrapy 蜘蛛,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27624778/

相关文章:

python - 强制外键最多被Django中的另一个表引用

python - Scrapy - 发送新请求/使用回调

python - 在 scrapy 中导出为 CSV 格式不正确

javascript - 在 python 服务器上从 Fabric.js JSON 构造图像

python - numpy 总是得到复杂的特征值和错误的特征向量

python - "register machine"到底是什么?

python - 无法在 python selenium 中正确获取所有图像 url

python - 使用 Selenium 更改 Google map 评论排序

python - 如何编写一个 python 程序,从给定的下拉菜单中选择所有可能的组合,从网站上获取结果 'scrapes' ?

docker - 如何使用 docker 工具箱运行 splash