我正在评估 Python 中随机森林回归器的测试性能,除了在训练集上运行交叉验证之外,我想知道是否适合在预测的 Y 之间运行某种相关性分析测试结果和实际Y测试结果?
我可能过于简单化的想法是,两者之间的显着相关性表明预测的 Y 与实际测试的 Y 一致,因此,预测是好的......
我们非常欢迎任何替代建议。谢谢。
最佳答案
您可以运行相关性分析,这是合适的,但如果相关性很大,则并不总是正确的,您的模型就很好。您还必须查看变化。还取决于您正在解决什么任务(分类、分割、回归等),您可以使用指标来检测您的预测效果如何。您可以在此处找到不同的指标 http://scikit-learn.org/stable/modules/model_evaluation.html .
关于python - 使用 R-Squared 评估随机森林性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52061313/