machine-learning - 为什么要使用交叉验证?

标签 machine-learning artificial-intelligence cross-validation kaggle

我目前正在参加几场 Kaggle 机器学习竞赛,我有一个简单的问题。为什么我们使用交叉验证来评估我们的算法在这些比赛中的有效性?

在这些比赛中,您在公共(public)排行榜上的得分(您的算法根据实际实时数据进行测试)肯定会让您更准确地表示您的算法功效吗?

最佳答案

交叉验证是模型构建的必要步骤。如果交叉验证给出的结果很差,那么即使在实时数据上尝试也是没有意义的。您正在训练和验证的数据集也是实时数据,不是吗?所以,结果应该是相似的。如果不验证您的模型,您就无法深入了解其性能。在训练集上给出 100% 准确度的模型可以在验证集上给出随机结果。

让我重申一下,交叉验证并不能替代实时数据测试,它是模型构建过程的一部分。

关于machine-learning - 为什么要使用交叉验证?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21445750/

相关文章:

python - 理解 python xgboost cv

r - 使用 Caret 包进行随机森林(回归)时出错

基于其他矩阵的矩阵元素预测

artificial-intelligence - 聚合概率计划

java - 使用预制模型文件预测在 WEKA 中动态创建的数据

python - tensorflow 收敛但预测不佳

javascript - 在客户端 javascript 中使用/生产经过训练的机器学习模型?

python-2.7 - 从递归特征消除 (RFE) 中提取最佳特征

machine-learning - 为什么网络模型平均值可以提高测试集的性能?

r - Caret 交叉验证中每个折叠的测试集和训练集