deep-learning - Caffe快照: . SolverState与.CaffeModel

标签 deep-learning caffe

训练网络时，每N次迭代拍摄的快照会以两种形式同时出现。一个是.solverstate文件，我想它就是听起来像的样子，它存储损失函数和梯度的状态，等等。另一个是.caffemodel文件，我知道该文件存储了经过训练的参数。

如果需要预训练的模型，.caffemodel是您需要的文件，因此我想如果要测试网络，它也是您想要的文件。

.solverstate有什么用？在this tutorial中，您似乎可以从中重新开始训练，但这与使用.caffemodel有何不同？ .solverstate是否也包含与.caffemodel相同的信息？换句话说，.caffemodel只是.solverstate的子集吗？

最佳答案

顾名思义，solverstate文件存储的是求解器的状态，而不存储与分类结果有关的任何信息。该模型另存为caffemodel文件，可用于获取数据的分类结果。如果要微调网络，可以使用预先训练的caffemodel文件。这将节省时间，因为您的网络不需要从头开始学习。但是，如果由于停电或意外重启而需要停止当前的培训，则可以从求解器状态的先前快照继续进行培训。使用solverstate和caffemodel文件之间的区别在于，前者允许您以预定方式完成训练，而后者可能需要更改某些训练参数，例如最大迭代次数。

关于deep-learning - Caffe快照: . SolverState与.CaffeModel，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36504628/

上一篇：django:如何在模板中包含静态文件？

下一篇：npm - 权限被拒绝覆盖或删除节点目标

c++ - Caffe 中的最小-最大归一化层

tensorflow - 使用 sparse_softmax_cross_entropy_with_logits 的中频平衡

tensorflow - 图像馈送到深度神经网络

具有不同维度的python卷积

machine-learning - 如何理解 tensorflow 张量板直方图？

python - 如何在卷积层pycaffe中设置bias_term false？

python - CNN 过度拟合(附输出和代码)

python - 如何在训练有素的网络上实现 Grad-CAM