machine-learning - 什么是多头模型？模型中的 'head' 到底是什么？

什么是深度学习中的多头模型？

到目前为止我发现的唯一解释是:每个模型都可以被认为是 Backbone 加一个头，如果你预先训练 Backbone 并放置一个随机头，你可以对其进行微调，它是好主意
有人可以提供更详细的解释吗？

最佳答案

您找到的解释是准确的。根据您想要对数据进行预测的内容，您需要足够的 Backbone 络和一定数量的预测头。

例如，对于基本分类网络，您可以将 ResNet、AlexNet、VGGNet、Inception...视为主干，将全连接层视为唯一的预测头。

对于需要多头的问题，定位是一个很好的例子，您不仅想要对图像中的内容进行分类，还想要定位对象(找到它周围的边界框的坐标)。

下图展示了总体架构

主干网络(“卷积和池化”)负责从包含更高级别汇总信息的图像中提取特征图。每个头都使用此特征图作为输入来预测其所需的结果。

您在训练期间优化的损失通常是每个预测头的各个损失的加权和。

关于machine-learning - 什么是多头模型？模型中的 'head' 到底是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56004483/