machine-learning - 使用多个种子的 K 折交叉验证来评估模型的正确方法是什么？

标签 machine-learning deep-learning cross-validation

我正在使用三个随机种子的 5 倍 CV 来训练深度学习模型(随机种子用于模型初始化，CV 被分割一次)。对于每次折叠，我都会保存最好的模型。因此，模拟后我得到了 15 个模型。为了评估性能，我选取了这 15 个模型中最好的一个(在整个评估过程中保持不变)，并使用每个种子的所有 5 倍的验证倍数对其进行评估。然后我对这些种子的结果进行平均。

我想知道我在这里做的事情是否正确。

我读到有两种计算 CV 性能的方法:[1] 池化，通过所有测试集的并集全局计算性能 [2] 平均，其中单独计算每个测试集的性能，结果是这些的平均值。

我打算使用方法二(平均)。

最佳答案

是的，您可以使用 5 倍 CV 的平均方法，但我不明白您所说的“对于每次折叠，我保存最佳模型”是什么意思。此外，三个随机种子值是不够的。您应该使用至少 10 个不同的值，并为这些种子的相应结果绘制箱线图。

关于machine-learning - 使用多个种子的 K 折交叉验证来评估模型的正确方法是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59668221/