r - 找出 R H2O AutoML 模型最有贡献的变量/特征？

标签 r variables h2o

我目前正在使用一些保险数据来预测客户将属于哪种保险金额类别。为了实现这一目标，我使用 R 中 H2O 包的 AutoML 函数。现在我有了模型，我希望能够查看数据中的哪些变量/特征对模型做出的预测贡献最大。 H2O 可以实现这样的效果吗？如果没有，用 R 实现这一目标的另一个好选择是什么？谢谢!

最佳答案

绝对有可能。如果 AutoML 选择的最佳拟合模型不是整体，那么您可以使用以下方法来绘制变量重要性(其中模型是从 AutoML 中提取的模型)，

library(h2o)
h2o.varimp_plot(model)

如果最合适的模型是一个整体，那么事情会稍微复杂一些。一个不错的选择是使用 lime包以查看本地重要性。

 library(h2o)
 library(lime)

 ## Train explainer
 explainer <- lime(train, model)

 ## Get explanations for a subset of samples
 explanation <- explain(train[1:5, ], explainer, n_features = 10)

 ## Plot global explanations
 plot_explanations(explanation)

 ## Plot local explanations
 plot_features(explanation)

关于r - 找出 R H2O AutoML 模型最有贡献的变量/特征？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49980180/

上一篇：django - 如何显示外键子项的 Django Admin 更改 ListView ？

下一篇：airflow - 如何将 Apache Airflow 与 slack 集成？

相关文章：

r - R中的Uniroot解决方案

r - 如何从 h2o automl 保存所有模型

java - 在 h2o 中加载大于内存大小的数据

hadoop - YARN 提示 java.net.NoRouteToHostException : No route to host (Host unreachable)

r - 如何从数据帧创建边缘列表(展开，group_by？)

pdf - 将绘图对象存储在列表中

r - 使用 R 和直方图数据绘制 ECDF

python - 如何从 tkinter 中的单选按钮获取值？

sql-server - 如何将存储过程的结果放入表变量中？

linux - Bash 字符串比较不起作用