machine-learning - 我应该先执行交叉验证然后再进行网格搜索吗?

标签 machine-learning scikit-learn cross-validation grid-search

我是机器学习领域的新手。我的问题如下:我已经建立了一个模型,并且正在尝试优化该模型。通过做一些研究,我发现交叉验证可以用来帮助我避免过度拟合的模型。此外,Gridsearchcv 可用于帮助我优化此类模型的参数并最终确定最佳参数。

现在我的问题是,我应该先进行交叉验证,然后使用网格搜索来确定最佳参数,还是使用 GridsearchCV 就足够了,因为它本身会执行交叉验证?

最佳答案

参见 Cross validation with test data set .

如果您的数据集足够大,我的建议是:

  1. 将您的数据集拆分为训练和测试子集。
  2. 执行 GridSearchCV在您的训练数据集上。
  3. 在您的测试子集上评估您的最佳模型(来自 GridSearchCV)。

关于machine-learning - 我应该先执行交叉验证然后再进行网格搜索吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60204229/

相关文章:

python - 如何使用 lightgbm.cv 进行回归?

Java Weka获取具有给定属性值的所有实例

python-3.x - 如何在 TfidfVectorizer 中计算词频?

python - 使用 cross_val_score 计算的指标与从 cross_val_predict 计算的相同指标有何不同?

python - 如何处理文本和数字特征的组合?

python - One-Hot 编码训练和测试数据时形状不匹配。将 get_dummies 与管道一起使用时,Train_Data 比 Test_data 具有更多的虚拟列

R - 具有估计标准误差的线性回归的 k 折交叉验证

python - 具有不平衡类的 k 折分层交叉验证

machine-learning - 机器学习中的训练步骤时间是多少?

machine-learning - 如何根据加载的重量创建损失图? (model.load_weights) 如何将 model.load_weights 添加到历史记录中?