machine-learning - 具有对数和指数激活函数的卷积神经网络

标签 machine-learning neural-network keras conv-neural-network

我正在尝试使用 Keras 实现一个非常具体的卷积神经网络。

主要区别在于我必须使用非常规激活函数:log 和exp。 ConvNet的基本结构如下: 输入 => Conv2D => 激活日志 => 平均池 => 激活 Exp => ...

问题是:随着权重变得太小，log 激活值会迅速达到 -inf。

我需要使用log和exp的原因是因为对于某些层我想模拟*产品池*，这是当前层的较小窗口(过滤器)。如果我应用 log(a) 和 log(b)，我可以进行正常的平均池化 ~ log(a)+ log(b) 后跟一个 exp 激活，它对应于我想要的产品:a * b = exp( log(a)+log(b) ).

为了摆脱 -inf，我尝试使用 SGD 和较低的学习率来训练网络，这样我可以获得更大的权重，但没有成功。

请问，您是否知道如何避免由于权重很小而导致的 -inf，或者有一种更智能的方法来获得产品池而不需要记录激活函数？

谢谢。

最佳答案

您的激活输出快速达到 -inf 的事实告诉我，您的卷积层的输出非常小!我无法为您提供如何避免 -inf 的明确答案，因为这取决于您的网络结构、输入值的范围以及网络训练的任务。

但是，我建议两种可能的解决方案: