python - 使用 R-Squared 评估随机森林性能

标签 python correlation random-forest

我正在评估 Python 中随机森林回归器的测试性能,除了在训练集上运行交叉验证之外,我想知道是否适合在预测的 Y 之间运行某种相关性分析测试结果和实际Y测试结果?

我可能过于简单化的想法是,两者之间的显着相关性表明预测的 Y 与实际测试的 Y 一致,因此,预测是好的......

我们非常欢迎任何替代建议。谢谢。

最佳答案

您可以运行相关性分析,这是合适的,但如果相关性很大,则并不总是正确的,您的模型就很好。您还必须查看变​​化。还取决于您正在解决什么任务(分类、分割、回归等),您可以使用指标来检测您的预测效果如何。您可以在此处找到不同的指标 http://scikit-learn.org/stable/modules/model_evaluation.html .

关于python - 使用 R-Squared 评估随机森林性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52061313/

相关文章:

python - 如何在sklearn中使用时间序列数据进行分类

r - 当我的随机森林混淆矩阵显示该模型不擅长预测疾病时,为什么我的 ROC 图和 AUC 值看起来不错?

随机森林似乎不能处理超过 32 类因素。我该如何将这些因素纳入训练模型?

python - 有没有办法在全黑显示器上运行代码? (文字冒险)

python - 使用 QWebEngine 在同一窗口中打开任何链接(甚至_blank)

python - 如何将相关矩阵绘制为一组椭圆,类似于 R 露天包?

r - cor 仅显示 NA 或 1 的相关性 - 为什么?

r - R中的加权相关

python - 允许数据帧 "amount"列中的最后一行作为插 header value 以解决舍入误差

python - 从 Python KeyError 异常中获取键名