我在 H2O 中使用 xgboost 来执行二元分类任务。该数据集具有多个分类特征,模型在训练期间对其应用 one-hot 编码。
现在我想使用 SHAP ( https://github.com/slundberg/shap ) 在本地解释预测。为此,最好拥有具有独热编码列和值的数据帧。然而,我似乎找不到从 H2O 模型中得到这个的方法。
我可能可以手动重新创建 one-hot 编码,但也许有人知道更快的解决方案?
最佳答案
我们有一个 ticket open对此已经有一段时间了,但由于对此功能的需求增加,我们很快就会重新考虑这一点。现在,您必须使用as_data_frame()
将H2OFrame转换为Pandas DataFrame。方法,然后应用以下方法之一 solutions .
关于python - 获取one-hot编码的H2OFrame,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58326351/