python-3.x - 如何知道哪些特征对预测目标类别影响更大？

标签 python-3.x machine-learning scikit-learn deep-learning

我有一个业务问题，我已经在 python 中运行回归模型来预测我的目标值。当用我的测试集验证它时，我发现我的预测变量与我的实际值相差甚远。现在我想从这个模型中提取的是，哪个特征起到了使我的预测值与实际值偏离的作用(假设差异在于某个阈值)？我想对这些功能的影响力进行排名，以便我可以向我的客户发表演讲。谢谢

最佳答案

这取决于您选择的估计器，线性模型通常有一个 coef_ 方法，您可以调用它来获取每个特征使用的 coef，假设它们已经标准化，这会告诉您您想知道的内容。

如上所述，对于树模型，您具有特征重要性。您还可以使用此处描述的诸如 treeinterpreter 之类的库: Interpreting Random Forest

examples

关于python-3.x - 如何知道哪些特征对预测目标类别影响更大？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54417893/

上一篇：machine-learning - 如何将语音文件输入RNN/LSTM进行语音识别？

下一篇：c# - 训练模型而不在 ML.NET 中标记特征

python - 导入错误 : cannot import name signature

machine-learning - 为什么 Keras 中的多类分类时，binary_crossentropy 比 categorical_crossentropy 更准确？

machine-learning - 为什么我的成本函数给出了错误的答案？

python-3.x - 如何在 scikit-learn 中访问管道 GridSearchCV 内估计器的属性？

python - 在 Python 中读取 bmp 文件

python-3.x - 如何在 Python 3 中抑制 graphviz 警告？

python - 无法使我的脚本以所需的格式打印输出

python - 如何使用 scikit learn 保存一个热编码模型并预测新的编码数据？

python - 自定义 scikit 编码器抛出转换错误