machine-learning - 使用多个种子的 K 折交叉验证来评估模型的正确方法是什么?

标签 machine-learning deep-learning cross-validation

我正在使用三个随机种子的 5 倍 CV 来训练深度学习模型(随机种子用于模型初始化,CV 被分割一次)。对于每次折叠,我都会保存最好的模型。因此,模拟后我得到了 15 个模型。为了评估性能,我选取了这 15 个模型中最好的一个(在整个评估过程中保持不变),并使用每个种子的所有 5 倍的验证倍数对其进行评估。然后我对这些种子的结果进行平均。

我想知道我在这里做的事情是否正确。

我读到有两种计算 CV 性能的方法:[1] 池化,通过所有测试集的并集全局计算性能 [2] 平均,其中单独计算每个测试集的性能,结果是这些的平均值。

我打算使用方法二(平均)。

最佳答案

是的,您可以使用 5 倍 CV 的平均方法,但我不明白您所说的“对于每次折叠,我保存最佳模型”是什么意思。此外,三个随机种子值是不够的。您应该使用至少 10 个不同的值,并为这些种子的相应结果绘制箱线图。

关于machine-learning - 使用多个种子的 K 折交叉验证来评估模型的正确方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59668221/

相关文章:

python - 如何找到真实数据的概率分布和参数? (Python 3)

tensorflow - 如何使用有状态 LSTM 和 batch_size > 1 布置训练数据

python - 如何在 PyTorch 中做完全连接的批量归一化?

machine-learning - 为什么模型选择之前不进行模型调整?

python - sklearn.model_selection.train_test_split中的样本权重是什么

python - Python 中列表的相似性——根据客户的特征比较客户

python - Relu函数,返回0和大数

machine-learning - 推理时间取决于参数数量吗?

r - 使用 regsubsets 进行 Predict()

python - 错误: Classification metrics can't handle a mix of multiclass-multioutput and multilabel-indicator targets