我有一个业务问题,我已经在 python 中运行回归模型来预测我的目标值。当用我的测试集验证它时,我发现我的预测变量与我的实际值相差甚远。现在我想从这个模型中提取的是,哪个特征起到了使我的预测值与实际值偏离的作用(假设差异在于某个阈值)? 我想对这些功能的影响力进行排名,以便我可以向我的客户发表演讲。 谢谢
最佳答案
这取决于您选择的估计器,线性模型通常有一个 coef_ 方法,您可以调用它来获取每个特征使用的 coef,假设它们已经标准化,这会告诉您您想知道的内容。
如上所述,对于树模型,您具有特征重要性。您还可以使用此处描述的诸如 treeinterpreter 之类的库: Interpreting Random Forest
关于python-3.x - 如何知道哪些特征对预测目标类别影响更大?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54417893/