python - 将部分训练的 scikit-learn 模型存储或检查点到磁盘

我正在运行一个需要大约 11 个小时来训练的梯度提升模型。我在 Google Cloud 上使用抢占式实例来执行此操作(因为它更便宜)。问题是，我一直在丢失进度，因为实例在模型能够完成训练之前就终止了。

有没有办法检查点或将部分训练模型的进度保存到磁盘？这样当我重新运行代码时，训练应该从中断的地方恢复。

我知道 pickle 模块允许我将对象转储到磁盘上。但我不希望保存经过全面训练的模型，而是经过部分训练的模型。

最佳答案

检查 here有类似的问题。

对于 sklearn 的 Gradient Boosting，您可以使用 warm_start 进行设置。

关于python - 将部分训练的 scikit-learn 模型存储或检查点到磁盘，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58187971/

相关文章：

python - 创建给定位置的房地产价格指数