我是机器学习领域的新手。我的问题如下:我已经建立了一个模型,并且正在尝试优化该模型。通过做一些研究,我发现交叉验证可以用来帮助我避免过度拟合的模型。此外,Gridsearchcv 可用于帮助我优化此类模型的参数并最终确定最佳参数。
现在我的问题是,我应该先进行交叉验证,然后使用网格搜索来确定最佳参数,还是使用 GridsearchCV 就足够了,因为它本身会执行交叉验证?
最佳答案
参见 Cross validation with test data set .
如果您的数据集足够大,我的建议是:
- 将您的数据集拆分为训练和测试子集。
- 执行 GridSearchCV在您的训练数据集上。
- 在您的测试子集上评估您的最佳模型(来自 GridSearchCV)。
关于machine-learning - 我应该先执行交叉验证然后再进行网格搜索吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60204229/