machine-learning - 如何正确组合我的分类器?

标签 machine-learning ensemble-learning mlxtend

  • 我必须解决2 类分类问题
  • 我有2个分类器输出概率。它们都是不同架构的神经网络。 这 2 个分类器经过训练并保存到 2 个文件中。

现在我想构建元分类器,它将概率作为输入并学习这两个分类器的权重。 因此,它会自动决定我应该“信任”每个分类器的程度。

此模型的描述如下:
http://rasbt.github.io/mlxtend/user_guide/classifier/StackingClassifier/#stackingclassifier
我打算使用mlxtend库,但StackingClassifier似乎对模型进行了 retrofit 。
我不想 retrofit ,因为这需要很长时间。
我从另一个角度理解,为了“协调”各个分类器的工作,“调整”整个系统,需要进行 retrofit 。

遇到这种情况我该怎么办?

最佳答案

我不会谈论 mlxtend,因为我还没有使用过它,但我会告诉您总体思路。

您不必将这些模型重新适应训练集,但必须将它们重新适应训练集的一部分,以便您可以创建折叠预测。

具体来说,将训练数据分成几部分(通常是 3 到 10 个)。保留一 block (即折叠)作为验证数据,并在其他折叠上训练两个模型。然后,使用这两个模型预测验证数据的概率。重复该过程,将每次折叠视为验证集。最后,您应该获得训练集中所有数据点的概率。

然后,您可以使用这些概率和真实标签来训练元分类器。您可以对新数据使用经过训练的元分类器。

关于machine-learning - 如何正确组合我的分类器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45456112/

相关文章:

python - 顺序功能选择器值错误: continuous format is not supported

python - Numpy 数组减法创建一个具有不同维度的矩阵。如何纠正?

python - sklearn 提升 : cross-validation to find optimal number of estimators without restarting everytime

python-3.x - 如何使用for循环在决策树上正确实现bagging?

java - 不同模型(包括rf、glm)在h2o(R)中的堆叠

machine-learning - 堆叠分类器上的分类器数量是否必须等于我的训练/测试数据集的列数?

python - 安装 mlxtend 时权限被拒绝 (Python 3)

machine-learning - 位置感知推荐系统(协同过滤)?

machine-learning - 如何获取新段落的段落向量?

python - 如何保存和重新训练 neat-python 模型?