machine-learning - 什么是多头模型?模型中的 'head' 到底是什么?

标签 machine-learning neural-network deep-learning

什么是深度学习中的多头模型?

到目前为止我发现的唯一解释是:每个模型都可以被认为是 Backbone 加一个头,如果你预先训练 Backbone 并放置一个随机头,你可以对其进行微调,它是好主意
有人可以提供更详细的解释吗?

最佳答案

您找到的解释是准确的。根据您想要对数据进行预测的内容,您需要足够的 Backbone 络和一定数量的预测头

例如,对于基本分类网络,您可以将 ResNet、AlexNet、VGGNet、Inception...视为主干,将全连接层视为唯一的预测头。

对于需要多头的问题,定位是一个很好的例子,您不仅想要对图像中的内容进行分类,还想要定位对象(找到它周围的边界框的坐标)。

下图展示了总体架构 enter image description here

主干网络(“卷积和池化”)负责从包含更高级别汇总信息的图像中提取特征图。每个头都使用此特征图作为输入来预测其所需的结果。

您在训练期间优化的损失通常是每个预测头的各个损失的加权和。

关于machine-learning - 什么是多头模型?模型中的 'head' 到底是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56004483/

相关文章:

python - ML - 特征选择后获取特征名称 - SelectPercentile,python

python - 如何显示模型的输出?

tensorflow - ai平台云预测不起作用,但本地预测起作用

python - 用于多变量时间序列的循环神经网络 - TensorFlow

deep-learning - 在 Keras 中使用带小批量的有状态 LSTM 和可变时间步长的输入?

python - 属性错误: module 'tensorflow.python.pywrap_tensorflow' has no attribute 'TFE_Py_RegisterExceptionClass'

java - 神经网络基础知识倍增

machine-learning - 优化神经网络输入以实现收敛

image-processing - 如何使用 pytorch 只更新网络中的某些特定张量?

python - Keras 中分类变量的嵌入问题