machine-learning - 递归神经网络(Elman 网络)。上下文到隐藏层/隐藏到上下文层的权重需要更新吗?

标签 machine-learning neural-network

我刚刚开始研究循环神经网络。我在 Elman 的网络上找到了三个信息来源(Elman 1991)。

  1. (示例和代码)http://mnemstudio.org/neural-networks-elman.htm

  2. (纸质)http://www.sysc.pdx.edu/classes/Werbos-Backpropagation%20through%20time.pdf

  3. (问答)Elman and Jordan context values during training for neural network

根据第一个资源,从隐藏层到上下文/上下文到隐藏层的权重没有更新。

在第二个资源中,它还将这些更新设置为 0,这意味着它不会更新权重。

但在 Stackoverflow 上的第三个资源中,用户声称“上下文神经元神经元值本身不会随着训练的进行而更新。它们与下一层之间的权重已更新在训练期间。”

我理解上下文神经元在时间 t 保存隐藏神经元的值,并在 t + 1 将其(与输入神经元一起)馈送到隐藏神经元。但是我们是否必须更新其间的权重?

最佳答案

我不确定这个问题是否仍然重要,但这是我的解释:

从隐藏层到上下文层的权重固定为 1。这些权重不会更新。

但是,从上下文层返回到隐藏层的权重将会更新。否则网络如何学习如何处理过去的值?如果它们不改变,初始化它们的正确值是多少?当然不是 1。

上下文神经元的值将在训练期间更新。不是通过使用某种 sigmoid 函数,而是通过简单地复制隐藏层的值。

关于machine-learning - 递归神经网络(Elman 网络)。上下文到隐藏层/隐藏到上下文层的权重需要更新吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19109746/

相关文章:

machine-learning - 高斯混合模型的参数个数

r - R 中的模型学习时间

python - 如何在 tensorflow 中提取层或 ValueError : Shape (? , 4096) 必须具有排名 1

neural-network - 人工神经网络能预测体育比赛的结果吗?

neural-network - 在使用批量训练后使用 Keras LSTM 预测单个示例

c++ - 神经网络在 OpenCV 3.0 中只返回 NaN

python - 如何利用RBM提高文本分类的精度?

r - GBM R函数: get variable importance separately for each class

machine-learning - Spark:单词分类

python - 为什么我的简单线性模型在数据集 g(X) 上学习阈值函数 f(x) = (x > 0) 但在 X 上表现不佳?