deep-learning - Caffe快照: . SolverState与.CaffeModel

标签 deep-learning caffe

训练网络时,每N次迭代拍摄的快照会以两种形式同时出现。一个是.solverstate文件,我想它就是听起来像的样子,它存储损失函数和梯度的状态,等等。另一个是.caffemodel文件,我知道该文件存储了经过训练的参数。

如果需要预训练的模型,.caffemodel是您需要的文件,因此我想如果要测试网络,它也是您想要的文件。

.solverstate有什么用?在this tutorial中,您似乎可以从中重新开始训练,但这与使用.caffemodel有何不同? .solverstate是否也包含与.caffemodel相同的信息?换句话说,.caffemodel只是.solverstate的子集吗?

最佳答案

顾名思义,solverstate文件存储的是求解器的状态,而不存储与分类结果有关的任何信息。该模型另存为caffemodel文件,可用于获取数据的分类结果。如果要微调网络,可以使用预先训练的caffemodel文件。这将节省时间,因为您的网络不需要从头开始学习。但是,如果由于停电或意外重启而需要停止当前的培训,则可以从求解器状态的先前快照继续进行培训。使用solverstate和caffemodel文件之间的区别在于,前者允许您以预定方式完成训练,而后者可能需要更改某些训练参数,例如最大迭代次数。

关于deep-learning - Caffe快照: . SolverState与.CaffeModel,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36504628/

相关文章:

machine-learning - 在具有不同数据集的 DIGITS 中使用预训练模型时出错。如何根据新数据集修改图层?

c++ - Caffe 中的最小-最大归一化层

tensorflow - 使用 sparse_softmax_cross_entropy_with_logits 的中频平衡

tensorflow - 图像馈送到深度神经网络

具有不同维度的python卷积

machine-learning - 如何理解 tensorflow 张量板直方图?

python - 如何在卷积层pycaffe中设置bias_term false?

python - CNN 过度拟合(附输出和代码)

python - 如何在训练有素的网络上实现 Grad-CAM

jupyter-notebook - caffe/pycaffe 备忘单?