我的用例是这样的:我有 10 个蜘蛛
,并且全局 AUTO_THROTTLE_ENABLED
设置设置为 True
。问题是,对于其中一个蜘蛛
来说,没有自动节流
的运行时间是4天,但是有自动节流的运行时间是40天......
我想找到一个平衡点,让蜘蛛在15天内运行(3倍于原来的数量)。今天早上我一直在阅读 scrapy 文档,但整件事让我很困惑。谁能告诉我如何在全局范围内保持自动 throttle 启用,并降低其 throttle 的数量?
最佳答案
如果有人在 2020 年以后仍然需要答案。您可以覆盖每个蜘蛛的任何全局设置: https://docs.scrapy.org/en/latest/topics/settings.html#settings-per-spider
关于python - 如何设置 Scrapy Auto_Throttle 设置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29754112/