machine-learning - 如何正确组合我的分类器？

标签 machine-learning ensemble-learning mlxtend

我必须解决2 类分类问题。
我有2个分类器输出概率。它们都是不同架构的神经网络。这 2 个分类器经过训练并保存到 2 个文件中。

现在我想构建元分类器，它将概率作为输入并学习这两个分类器的权重。因此，它会自动决定我应该“信任”每个分类器的程度。

此模型的描述如下:
http://rasbt.github.io/mlxtend/user_guide/classifier/StackingClassifier/#stackingclassifier
我打算使用mlxtend库，但StackingClassifier似乎对模型进行了 retrofit 。
我不想 retrofit ，因为这需要很长时间。
我从另一个角度理解，为了“协调”各个分类器的工作，“调整”整个系统，需要进行 retrofit 。

遇到这种情况我该怎么办？

最佳答案

我不会谈论 mlxtend，因为我还没有使用过它，但我会告诉您总体思路。

您不必将这些模型重新适应训练集，但必须将它们重新适应训练集的一部分，以便您可以创建折叠预测。

具体来说，将训练数据分成几部分(通常是 3 到 10 个)。保留一 block (即折叠)作为验证数据，并在其他折叠上训练两个模型。然后，使用这两个模型预测验证数据的概率。重复该过程，将每次折叠视为验证集。最后，您应该获得训练集中所有数据点的概率。

然后，您可以使用这些概率和真实标签来训练元分类器。您可以对新数据使用经过训练的元分类器。

关于machine-learning - 如何正确组合我的分类器？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45456112/

上一篇：matrix - 神经网络中偏置单元的良好实现

下一篇：python-3.x - Iris 数据上的 Python 感知器代码不收敛

python - Numpy 数组减法创建一个具有不同维度的矩阵。如何纠正？

python - sklearn 提升 : cross-validation to find optimal number of estimators without restarting everytime

python-3.x - 如何使用for循环在决策树上正确实现bagging？

java - 不同模型(包括rf、glm)在h2o(R)中的堆叠

machine-learning - 堆叠分类器上的分类器数量是否必须等于我的训练/测试数据集的列数？

python - 安装 mlxtend 时权限被拒绝 (Python 3)

machine-learning - 位置感知推荐系统(协同过滤)？

machine-learning - 如何获取新段落的段落向量？

python - 如何保存和重新训练 neat-python 模型？