machine-learning - 递归神经网络(Elman 网络)。上下文到隐藏层/隐藏到上下文层的权重需要更新吗？

我刚刚开始研究循环神经网络。我在 Elman 的网络上找到了三个信息来源(Elman 1991)。

根据第一个资源，从隐藏层到上下文/上下文到隐藏层的权重没有更新。

在第二个资源中，它还将这些更新设置为 0，这意味着它不会更新权重。

但在 Stackoverflow 上的第三个资源中，用户声称“上下文神经元神经元值本身不会随着训练的进行而更新。它们与下一层之间的权重已更新在训练期间。”

我理解上下文神经元在时间 t 保存隐藏神经元的值，并在 t + 1 将其(与输入神经元一起)馈送到隐藏神经元。但是我们是否必须更新其间的权重？

最佳答案

我不确定这个问题是否仍然重要，但这是我的解释:

从隐藏层到上下文层的权重固定为 1。这些权重不会更新。

但是，从上下文层返回到隐藏层的权重将会更新。否则网络如何学习如何处理过去的值？如果它们不改变，初始化它们的正确值是多少？当然不是 1。

上下文神经元的值将在训练期间更新。不是通过使用某种 sigmoid 函数，而是通过简单地复制隐藏层的值。

关于machine-learning - 递归神经网络(Elman 网络)。上下文到隐藏层/隐藏到上下文层的权重需要更新吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19109746/

相关文章：

machine-learning - 高斯混合模型的参数个数