我目前正在使用一些保险数据来预测客户将属于哪种保险金额类别。为了实现这一目标,我使用 R 中 H2O 包的 AutoML 函数。现在我有了模型,我希望能够查看数据中的哪些变量/特征对模型做出的预测贡献最大。 H2O 可以实现这样的效果吗?如果没有,用 R 实现这一目标的另一个好选择是什么?谢谢!
最佳答案
绝对有可能。如果 AutoML 选择的最佳拟合模型不是整体,那么您可以使用以下方法来绘制变量重要性(其中模型是从 AutoML 中提取的模型
),
library(h2o)
h2o.varimp_plot(model)
如果最合适的模型是一个整体,那么事情会稍微复杂一些。一个不错的选择是使用 lime包以查看本地重要性。
library(h2o)
library(lime)
## Train explainer
explainer <- lime(train, model)
## Get explanations for a subset of samples
explanation <- explain(train[1:5, ], explainer, n_features = 10)
## Plot global explanations
plot_explanations(explanation)
## Plot local explanations
plot_features(explanation)
关于r - 找出 R H2O AutoML 模型最有贡献的变量/特征?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49980180/