例如:如果我想训练一个分类器(也许是SVM),我需要收集多少样本?有没有衡量方法?
最佳答案
要知道需要收集多少样本并不容易。但是您可以按照以下步骤操作:
解决典型的机器学习问题:
- 构建一个包含几个样本的数据集 a,有多少个?这取决于您遇到的问题类型,现在不要花太多时间。
- 将数据集拆分为训练、交叉、测试和构建模型。
- 既然您已经构建了机器学习模型,您需要评估它的好坏。计算您的测试误差
- 如果您的测试错误率低于您的预期,请收集新数据并重复步骤 1-3,直到达到您满意的测试错误率。
如果您的模型没有遭受“高偏差”,则此方法将起作用。
This video from Coursera's Machine Learning course, explains it .
关于machine-learning - 我如何知道训练数据足以用于机器学习,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24752941/