python - 将部分训练的 scikit-learn 模型存储或检查点到磁盘

标签 python scikit-learn

我正在运行一个需要大约 11 个小时来训练的梯度提升模型。我在 Google Cloud 上使用抢占式实例来执行此操作(因为它更便宜)。问题是,我一直在丢失进度,因为实例在模型能够完成训练之前就终止了。

有没有办法检查点或将部分训练模型的进度保存到磁盘?这样当我重新运行代码时,训练应该从中断的地方恢复。

我知道 pickle 模块允许我将对象转储到磁盘上。但我不希望保存经过全面训练的模型,而是经过部分训练的模型。

最佳答案

检查 here有类似的问题。

对于 sklearn 的 Gradient Boosting,您可以使用 warm_start 进行设置。

关于python - 将部分训练的 scikit-learn 模型存储或检查点到磁盘,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58187971/

相关文章:

python - 创建给定位置的房地产价格指数

调用 XGBoost .fit 后的 Python sklearn NotFittedError

python - IndexError : too many indices for array. 具有 42 个特征的 Numpy 数组不均匀

python - pandas.read_csv() 将 TRUE 解释为 bool 值,我需要一个字符串

python - Tkinter 跟踪和值错误 : invalid literal for int() with base 10: ''

python - 在远程 SFTP 服务器上解压 tar.gz

python - pandas 函数基于 dict 创建组合列

python - 如何对具有两个值的列进行单热编码?

python - 如何仅返回正则表达式的特定部分?

machine-learning - 如何从惩罚逻辑回归的拟合管道中提取系数?