python-3.x - 如何知道哪些特征对预测目标类别影响更大?

标签 python-3.x machine-learning scikit-learn deep-learning

我有一个业务问题,我已经在 python 中运行回归模型来预测我的目标值。当用我的测试集验证它时,我发现我的预测变量与我的实际值相差甚远。现在我想从这个模型中提取的是,哪个特征起到了使我的预测值与实际值偏离的作用(假设差异在于某个阈值)? 我想对这些功能的影响力进行排名,以便我可以向我的客户发表演讲。 谢谢

最佳答案

这取决于您选择的估计器,线性模型通常有一个 coef_ 方法,您可以调用它来获取每个特征使用的 coef,假设它们已经标准化,这会告诉您您想知道的内容。

如上所述,对于树模型,您具有特征重要性。您还可以使用此处描述的诸如 treeinterpreter 之类的库: Interpreting Random Forest

examples

关于python-3.x - 如何知道哪些特征对预测目标类别影响更大?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54417893/

相关文章:

python - 当参数默认为 None 时使用 __repr__,但可能是一个 str

python - 导入错误 : cannot import name signature

machine-learning - 为什么 Keras 中的多类分类时,binary_crossentropy 比 categorical_crossentropy 更准确?

machine-learning - 为什么我的成本函数给出了错误的答案?

python-3.x - 如何在 scikit-learn 中访问管道 GridSearchCV 内估计器的属性?

python - 在 Python 中读取 bmp 文件

python-3.x - 如何在 Python 3 中抑制 graphviz 警告?

python - 无法使我的脚本以所需的格式打印输出

python - 如何使用 scikit learn 保存一个热编码模型并预测新的编码数据?

python - 自定义 scikit 编码器抛出转换错误