我想知道 Keras 中的激活层和密集层有什么区别。
由于 Activation Layer 似乎是一个全连接层,而 Dense 有一个参数来传递一个激活函数,那么最佳实践是什么?
让我们想象一个像这样的虚构网络: 输入 -> 密集 -> 辍学 -> 最终层 最终层应该是:Dense(activation=softmax) 还是 Activation(softmax) ? 什么是最干净的,为什么?
谢谢大家!
最佳答案
使用 Dense(activation=softmax)
在计算上等同于先添加 Dense
然后添加 Activation(softmax)
。但是,第二种方法有一个优点 - 您可以从此类定义的模型中检索最后一层(激活之前)的输出。在第一种方法中 - 这是不可能的。
关于python - Keras 中 Dense 和 Activation 层的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40866124/