scikit-learn - 如何从网格搜索中挑选出最佳模型?

标签 scikit-learn

在执行网格搜索 CV 后,我想挑选出最好的模型以供将来使用。当我做类似的事情

grid_search = GridSearchCV(SVC_clf, parameters, n_jobs=-1, verbose=1, cv = 3)

gs = grid_search.fit(X, Y)


with open('../MLA (pickled)/SVC.txt','w') as f:
    s = pickle.dumps(gs)
    f.write(s)

然后

with open('../MLA (pickled)/SVC.txt','r') as f:
    clf = pickle.loads( f.read() )
clf.fit(X_new,Y_new)

网格搜索再次开始。这将是非常痛苦的,特别是如果参数网格非常大。

如何从网格搜索中挑选“最佳”模型?

最佳答案

哦,我明白了。看起来gs是一个best_estimator_。所以我应该pickle gs.best_estimator_

关于scikit-learn - 如何从网格搜索中挑选出最佳模型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37452141/

相关文章:

python - 为什么我定制的线性回归模型不匹配 sklearn?

python - 将数据集中的特征添加到函数中会导致 "TypeError: can' t 将类型 'ndarray' 转换为分子/分母”

python - 如何从流水线网格搜索和 cross_val_score 中获得最佳估计器和参数?

python - 使用 scikit-learn 时出现属性错误

machine-learning - 这是过度拟合的例子吗?

python-2.7 - 带有 HashingVectorizer 和 TfidfTransformer 的 SGDClassifier

python - 映射 - 特征重要性与标签分类

scikit-learn - sklearn.base 中的 BaseEstimator (Python)

python - 如何在带有朴素贝叶斯分类器和 NLTK 的 scikit 中使用 k 折交叉验证

python - 为什么随机森林需要更长的时间来拟合具有虚拟变量的数据框?