r - 种子值会影响 R 中训练数据的结果吗？

标签 r machine-learning neural-network analytics

我正在尝试创建一个模型，将我的数据分为训练(70%)、验证(15%)和测试(15%)集。运行模型后，我得到了一些准确性(ROC)和一些值(value)我的混淆矩阵。但是每次我不断改变种子值，它都会影响我的输出。我该如何解决这个问题？这是预期的行为吗？如果是这样，我怎样才能得出选择哪个值作为最终输出的结论？

最佳答案

set.seed() 定义生成随机值的起点。使用相同的种子运行分析应该返回相同的结果。使用不同的种子可能会导致不同的输出。在您的情况下，可能是因为训练、验证和测试的划分不同。

如果差异很小，可以接受，那么您的模型对于训练、测试和验证中的不同分割来说是稳健的。如果差异很大，则您的模型不稳健，不值得信任。您将必须更改数据的分割方式(分层可能会有所帮助)或修改模型。

关于r - 种子值会影响 R 中训练数据的结果吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36174185/

上一篇：machine-learning - 使用 Vowpal Wabbit 忘记单个示例

下一篇：machine-learning - Izhikevich 神经元模型是否使用权重？

相关文章：

r - 带有突出显示的国家和选定城市的简单世界地图

r - 寻找最小正值

python - scikit-learn GMM 产生正对数概率

java - 将 1D 数据集映射到 3D 空间

machine-learning - Beam Search 如何对 The Transformer 的输出进行操作？

c - C 中的感知器无法训练

python - ML 预测算法遇到问题

r - 从 igraph 对象中提取 vnames

r - 在以逗号分隔的其他列中添加该列的位置列

python - 输入层的形状