scikit-learn - 如果我在完成之前中断sklearn grid_search.fit(),我可以访问当前的.best_score_、.best_params_吗?

标签 scikit-learn grid-search

如果我在完成之前中断 grid_search.fit() ,我会丢失迄今为止所做的一切吗? 我对网格搜索有点得意忘形,并提供了一个大得令人发指的搜索空间。我可以看到我已经满意的分数,但我的标准输出不显示哪些参数导致了这些分数..

我搜索了文档:http://scikit-learn.org/stable/modules/generated/sklearn.grid_search.GridSearchCV.html

几年前有一次关于在此处添加并行搜索功能的讨论:https://sourceforge.net/p/scikit-learn/mailman/message/31036457/

但没有什么确定的。我的搜索已经进行了约 48 小时,所以我不想丢失已发现的内容,但我也不想继续。

谢谢!

最佳答案

欢迎来到SO!

据我了解,grid_search 函数没有返回任何中间变量,只有结果网格及其分数(有关更多信息,请参阅此处 grid search.py )。

因此,如果您取消它,您可能会丢失迄今为止已完成的工作。

但是有一点建议,48 小时是一个很长的时间(显然这取决于正在调整的行、列和超参数的数量)。 您可能希望首先从更广泛的网格搜索开始,然后在此基础上优化参数搜索。

这将使您在两个方面受益:

  1. 运行时间最终可能会更短(请参阅上面的注意事项),这意味着您不必等待这么长时间,也不必冒失去结果的风险

  2. 您可能会发现您的模型预测得分仅受一两个超参数的影响,从而让您可以更广泛地进行其他搜索,并将精力集中在对预测准确性影响最大的参数上。

希望在我写下此回复时,您的网格搜索已经完成!!

关于scikit-learn - 如果我在完成之前中断sklearn grid_search.fit(),我可以访问当前的.best_score_、.best_params_吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39377052/

相关文章:

python - 如何将 LabelEncoder 应用于 Pandas 数据框中的特定列

python - 决策树显示没有达到我想要的效果

python-3.x - 使用LightGBM的网格搜索示例

python - 网格搜索 SVC : IndexError: too many indices for array

python - 导入错误 : cannot import name '_safe_split'

machine-learning - 使用 TensorFlow 进行图像相似度检测

python - StatsModels:为什么我们必须拟合模型?

python - Scikit - 结合规模和网格搜索

python - 精度比 gridsearchCV 低

python - "Parallel"使用 gridsearch 获得最佳模型的管道