python - 训练和验证数据结构

标签 python validation machine-learning

如果我对机器学习分类器使用相同的训练数据和验证数据会发生什么?

最佳答案

如果训练数据和验证数据相同,训练后的分类器将具有很高的准确性,因为它已经看到了数据。这就是我们使用训练-测试分割的原因。我们使用 60-70% 的训练数据来训练分类器,然后针对 30-40% 的数据(分类器尚未见过的验证数据)运行分类器。这有助于根据没有标签的真实测试集来衡量分类器及其行为的准确性,例如过度拟合或欠拟合。

关于python - 训练和验证数据结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65534207/

相关文章:

python - 使用混合类型的多个数组创建文本文件python

python - 使用 keras 1.2 的神经网络模型可视化

python - PyTorch : predict single example

machine-learning - 成本函数训练目标与准确性期望目标

machine-learning - 教学神经网络异或函数

python - 如何在其他(已经启动的)任务完成后运行任务

python - GTK 和 PYGTK 的区别

java - 使用扫描仪验证多个输入

javascript - 为什么当我的 javascript 函数返回 false 时我的表单仍然提交?

javascript - 通过 ID 阻止 jQuery 中的表单提交