python - 训练 fc 层后微调 PyTorch 模型

我正在尝试使用 PyTorch 进行迁移学习。我想先训练 FC 层，然后微调整个网络。不幸的是，在训练 fc 层然后通过我的网络进行微调之后，我失去了在第一次训练中获得的准确性。这是预期的行为还是我在这里做错了什么？

这是代码:

model = torchvision.models.resnet50(pretrained=True)
for param in model.parameters():
    param.requires_grad = False

num_ftrs = model.fc.in_features
model.fc = nn.Linear(num_ftrs, 4)
model = model.to(device)

criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

model = trainer.fit_model(dataloader, model, criterion, optimizer, num_epochs=10)
# fit model is basic PyTorch training function found here: https://pytorch.org/tutorials/beginner/transfer_learning_tutorial.html#convnet-as-fixed-feature-extractor The only difference is that scheduler is an optional param.

for param in model.parameters():
    param.requires_grad = True

torch.cuda.empty_cache()
exp_lr_scheduler = lr_scheduler.StepLR(optimizer, step_size=7, gamma=0.1)

# Here I am finetuning the model
model_ft = trainer.fit_model(
    dataloader, model, criterion, optimizer, scheduler=exp_lr_scheduler, num_epochs=10
)

我在这里遗漏了一些东西还是我应该只训练模型一次？

最佳答案

这是在执行迁移学习时可能发生的事情，称为 灾难性遗忘。基本上，您过多地更新了预训练权重，并且“忘记”了之前学到的内容。如果你的学习率太高，这种情况可能会发生。我建议首先尝试较低的学习率，或者使用可微分的学习率(网络头部和预训练部分的学习率不同，这样你就可以在 fc 层上获得比其余部分更高的学习率)网络)。

关于python - 训练 fc 层后微调 PyTorch 模型，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57655007/

python - 训练 fc 层后微调 PyTorch 模型

上一篇：python - 如果其中一列具有相同数据，如何通过从每个列中选择几列来连接两个数据框

下一篇：python - 给定一个元素 A 从 python 列表中查找 A 的上一个和下一个元素