python - Keras LSTM 中的内核和循环内核

标签 python machine-learning keras lstm

我试图在脑海中勾勒 LSTM 的结构，但我不明白什么是内核和循环内核。根据这个post在 LSTM 部分，内核是与输入相乘的四个矩阵，循环内核是与隐藏状态相乘的四个矩阵，但是，图中的这 4 个矩阵是什么？

是门吗？
我正在测试这个 app怎么了unit下面代码的变量影响内核、循环内核和偏差:

model = Sequential()
model.add(LSTM(unit = 1, input_shape=(1, look_back)))

与 look_back = 1它告诉我:

与 unit = 2它返回给我这个

与 unit = 3这个

用这个值测试我可以推导出这个表达式

但我不知道这在内部是如何工作的。什么意思<1x(4u)>或 <ux(4u)> ? u = units

最佳答案

内核基本上是 LSTM 单元处理的权重
单位 = 神经元，就像经典的多层感知器
它没有显示在您的图表中，但输入是一个具有 1 个或多个值的向量 X，每个值都发送到一个具有自己权重 w 的神经元中(我们将通过反向传播来学习)
这四个矩阵是这些(表示为 Wf、Wi、Wc、Wo):

当您添加一个神经元时，您正在添加其他 4 个权重\内核
因此，对于您的输入向量 X，您有四个矩阵。因此