python - 在 PyTorch 中加载用于推理的迁移学习模型的正确方法是什么？

我正在使用基于 Resnet152 的迁移学习来训练模型。基于 PyTorch 教程，我在保存经过训练的模型并加载它以进行推理方面没有问题。但是，加载模型所需的时间很慢。我不知道我做对了没有，这是我的代码:
将训练好的模型保存为状态字典:

torch.save(model.state_dict(), 'model.pkl')

加载它以进行推理:

model = models.resnet152()
num_ftrs = model.fc.in_features
model.fc = nn.Linear(num_ftrs, len(classes))
st = torch.load('model.pkl', map_location='cuda:0' if torch.cuda.is_available() else 'cpu')
model.load_state_dict(st)
model.eval()

我对代码进行计时，发现第一行model = models.resnet152()加载时间最长。在 CPU 上，测试一张图像需要 10 秒。所以我的想法是这可能不是加载它的正确方法？
如果我像这样保存整个模型而不是 state.dict:

torch.save(model, 'model_entire.pkl')

并像这样测试它:

model = torch.load('model_entire.pkl')
model.eval()

在同一台机器上，测试一张图像只需 5 秒。
所以我的问题是:这是加载 state_dict 进行推理的正确方法吗？

最佳答案

在第一个代码片段中，您从 TorchVision 下载模型(具有随机权重)，然后将您的(本地存储的)权重加载到它。
在第二个示例中，您正在加载本地存储的模型(及其权重)。
前者会更慢，因为您需要连接到托管模型的服务器并下载它，而不是本地文件，但它更易于复制，不依赖于您的本地文件。此外，时间差应该是一次性初始化，并且它们应该具有相同的时间复杂度(因为在您执行推理时，模型已经加载到两者中，并且它们是等效的)。

关于python - 在 PyTorch 中加载用于推理的迁移学习模型的正确方法是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56307488/

上一篇：ruby-on-rails - 如何通过 Rails 6 中的浏览器控制台访问自定义 javascript 函数

下一篇：python - 不同的 :maxdepth: for specific entries in toctree (Sphinx)

相关文章：

python - 如何在 Matplotlib 中设置不相等的 x 轴间隔

python - 最小化到托盘，陷入循环，python gtk

c - 在 Ubuntu 18.04 上编译 Python 3.7.4 时测试失败

cuda - 如何确保 Vulkan 使用与 CUDA 相同的 GPU？

deep-learning - 如何在pytorch中实现低维嵌入层

python - 在 azure 中的 pip 上安装 _mysql 模块时出现问题

python - 组内累计金额

python-3.x - headless chrome 网络驱动程序太慢，无法下载文件

python - 整数除法 : is a//b == int(a/b) true for all integers a, b?

python - 当使用 .clamp 而不是 torch.relu 时，Pytorch Autograd 会给出不同的渐变