python - 在 H2O 中校准 AutoML 模型

标签 python machine-learning h2o

从我在 docs 中看到的, H2O 仅支持 GBM、DRF、XGBoost 模型的校准,并且必须在训练阶段之前指定。

我觉得很困惑。如果校准是后处理步骤并且与模型无关,那么即使在训练过程完成后,是否也可以校准使用 H2O 训练的任何模型?

目前,我正在处理一个使用AutoML训练过的模型。 。尽管它是 GBM 模型,但我无法通过提供 calibrate_model 参数轻松校准它,因为 AutoML 不支持它。我也没有看到任何在训练后对其进行校准的选项。

有人知道校准已经训练过的 H2O 模型的简单方法吗?是否有必要使用 Platt 缩放等算法“手动”校准它们,或者有没有一种方法可以在不使用任何额外库的情况下进行校准? 谢谢

最佳答案

I find it confusing. If calibration is a post-processing step

它现在成为模型训练的一部分的原因是为了将它放在 MOJO(我们的部署工件)中。

and is model agnostic, shouldn't it be possible to calibrate any model trained using H2O, even after the training process is finished?

事后校准模型非常有意义,所有代码都已经存在 - 它“只是”需要暴露给用户。我们为此创建了一张票here .

关于python - 在 H2O 中校准 AutoML 模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67602679/

相关文章:

hadoop - H20 Hadoop 启动

java - h2o 基本解析文件

Python Selenium - 自动填写表单 - 单击不是提交按钮的按钮并从列表中填写表单

python - 如何创建具有自定义起点和步长值的矩形网格

python - 如何将此查询转换为 Peewee ORM?

machine-learning - 用于衣服和鞋子的模式识别的深度学习

machine-learning - Apache Flink 数据流上的随机异常值选择

python - 无法使用openCV从图像中提取每个文本

python - Keras 测试后预测值

python-3.x - 如何使用 GPU 中的 panda dataframe 读取 csv 文件?