问:Tensorflow RNN 是否实现了输出 Elman 网络的隐藏状态？

cells  = tf.contrib.rnn.BasicRNNCell(4) 
outputs, state = tf.nn.dynamic_rnn(cell=cells, etc...)

我对 TF 的 RNN 很陌生，对输出和状态的含义很好奇。我正在关注斯坦福的 tensorflow 教程，但似乎没有详细的解释，所以我在这里问。经过测试，我认为 state 是序列计算后的隐藏状态，而 outputs 是每个时间步后的隐藏状态数组。

所以我想说清楚。 outputs 和 state 只是隐藏状态向量，所以要完全实现 Elman 网络，我必须在图片中制作 V 矩阵并再次进行矩阵乘法。我对么？

最佳答案

我相信你问的是中间状态和输出的输出是什么。

据我了解，状态将是卷积/序列计算后的中间输出并且是隐藏的，因此您的理解是正确的。

输出可能会因您决定如何实现网络模型而有所不同，但一般来说，它是一个数组，其中应用了任何操作(卷积、序列计算等)，然后应用了激活和下采样/池化，专注于该层的可识别特征。

来自 Colah 的博客 ( http://colah.github.io/posts/2015-08-Understanding-LSTMs/ ):

最后，我们需要决定要输出什么。此输出将基于我们的细胞状态，但将是过滤后的版本。首先，我们运行一个 sigmoid 层，它决定我们要输出细胞状态的哪些部分。然后，我们将单元状态通过 tanhtanh(将值推到 −1−1 和 11 之间)并将其乘以 sigmoid 门的输出，这样我们就只输出我们决定输出的部分。

对于语言模型示例，由于它刚刚看到一个主语，它可能想要输出与动词相关的信息，以防接下来会发生这种情况。例如，它可能会输出主语是单数还是复数，以便我们知道如果接下来是动词应该变位的形式。

希望这对您有所帮助。谢谢

关于tensorflow - Tensorflow RNN 是否完全实现了 Elman 网络？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43839701/

tensorflow - Tensorflow RNN 是否完全实现了 Elman 网络？

问:Tensorflow RNN 是否实现了输出 Elman 网络的隐藏状态？

上一篇：sql-server - 如何解决此 visual studio 查询错误？

下一篇：python - 在图表外创建图例