- 我必须解决2 类分类问题。
- 我有2个分类器输出概率。它们都是不同架构的神经网络。 这 2 个分类器经过训练并保存到 2 个文件中。
现在我想构建元分类器,它将概率作为输入并学习这两个分类器的权重。 因此,它会自动决定我应该“信任”每个分类器的程度。
此模型的描述如下:
http://rasbt.github.io/mlxtend/user_guide/classifier/StackingClassifier/#stackingclassifier
我打算使用mlxtend库,但StackingClassifier似乎对模型进行了 retrofit 。
我不想 retrofit ,因为这需要很长时间。
我从另一个角度理解,为了“协调”各个分类器的工作,“调整”整个系统,需要进行 retrofit 。
遇到这种情况我该怎么办?
最佳答案
我不会谈论 mlxtend
,因为我还没有使用过它,但我会告诉您总体思路。
您不必将这些模型重新适应训练集,但必须将它们重新适应训练集的一部分,以便您可以创建折叠预测。
具体来说,将训练数据分成几部分(通常是 3 到 10 个)。保留一 block (即折叠)作为验证数据,并在其他折叠上训练两个模型。然后,使用这两个模型预测验证数据的概率。重复该过程,将每次折叠视为验证集。最后,您应该获得训练集中所有数据点的概率。
然后,您可以使用这些概率和真实标签来训练元分类器。您可以对新数据使用经过训练的元分类器。
关于machine-learning - 如何正确组合我的分类器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45456112/