我训练了一个简单的随机森林分类器,然后当我使用相同的测试输入测试预测时:
rf_clf.predict([[50,0,500,0,20,0,250000,1.5,110,0,0,2]])
rf_clf.predict_proba([[50,0,500,0,20,0,250000,1.5,110,0,0,2]])
第一行返回array([1.])
,而第二行返回array([[0.14, 0.86]])
,其中预测是第一个 float 0.14
对吧?
这两个怎么不匹配?我有点困惑。谢谢。
最佳答案
predict()
函数返回特征所属的类,predict_proba()
函数返回特征属于不同输出类的概率。
示例:
predict()
函数的输出给出的结果是该特征属于第 1 类(即 array([1.])
predict_proba()
函数的输出为您提供属于每个输出类数组的特征的概率 ([[0.14, 0.86]])。特征属于类别 0 的概率为 14%,特征属于类别 1 的概率为 86%。
关于python - 为什么随机森林分类器 .predict() 和 .predict_proba() 的预测不匹配?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67554970/