我正在使用 sklearn RFC。
forest.fit(training_data, y_train)
probas_test = forest.predict_proba(test_data)
我想知道是否有一种方法可以找到导致预测的每个特征的贡献/重要性。
类似于 ,但针对单个数据点级别。
forest.feature_importances_
最佳答案
这个问题可以通过多种方式解决;检查http://blog.datadive.net/interpreting-random-forests/ (以及一个Python包: https://github.com/andosa/treeinterpreter )。还有一些不太直接的选择,例如
关于machine-learning - 随机森林分类器 : feature importance of prediction probability,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41060913/