如果我对机器学习分类器使用相同的训练数据和验证数据会发生什么?
最佳答案
如果训练数据和验证数据相同,训练后的分类器将具有很高的准确性,因为它已经看到了数据。这就是我们使用训练-测试分割的原因。我们使用 60-70% 的训练数据来训练分类器,然后针对 30-40% 的数据(分类器尚未见过的验证数据)运行分类器。这有助于根据没有标签的真实测试集来衡量分类器及其行为的准确性,例如过度拟合或欠拟合。
关于python - 训练和验证数据结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65534207/