machine-learning - 分类任务的显着性检验

标签 machine-learning statistics classification significance

假设对于一个分类任务,我有算法 A 和算法 B,以及大小为 M 的标记数据集。算法 A 和算法 B 都是“确定性”机器学习方法,也就是说,算法不具有一些参数是随机种子,因此给定不同的随机种子,即使使用相同的数据集,训练的分类器也可能不同。

我的问题是,如果我想证明算法 A 在统计上比算法 B 更好(或更差),我应该怎么做?

最佳答案

嗯,按照您描述问题的方式,检查统计差异的唯一方法是改变数据集。生成几个不同的数据集,并对它们运行算法 A 和 B,比较结果(不清楚您的质量指标是结果正确性还是所用时间,但它是双向的)。

关于machine-learning - 分类任务的显着性检验,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25927825/

相关文章:

machine-learning - 为什么IS曲线以(0,0)开始?

machine-learning - 神经网络中的神经元在哪里共享其预测结果(学习功能)?

machine-learning - 最小二乘和X'Xθ = X'y 有什么关系?

python - 查找数据异常值

r - ARIMA 的 R 和 Stata 之间的主要差异

matlab - 在 SVM 中处理大型核矩阵

neural-network - 卷积神经网络为什么使用ReLU作为激活单元?

r - R 中的内存高效分类器,用于极宽且不太长的训练集

python - 如何正确绘制训练集和验证集的损失曲线?

Python - 内部相似性