我正在尝试在 Tensorflow 中构建一个多任务 CNN,它有两个并行的密集层,一个用于年龄预测,另一个用于性别预测。我如何为不同数量的纪元训练每个密集层,因为一个可以先于另一个纪元收敛,并且对相同的纪元数进行训练会使其中一个过拟合?
此外,如果我将年龄和性别的梯度传播到 CNN,它是否会过度拟合,因为它的权重更新速度是密集层的两倍?
最佳答案
我问过类似的问题,我终于找到了答案:LINK
解决方案:您可以定义2 个不同的train_step,每个都有自己的学习率。每个 train_step 都可以调用选定的次数。此外,如果您希望某些变量仅可针对选定的 train_step 进行训练,则可以定义一些依赖项。 (参见 documentation)。
关于python - 如何在 Tensorflow 中以不同的学习率训练两个密集层?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52159239/