algorithm - 我应该使用哪种优化算法来优化多层感知器的权重?

标签 algorithm optimization neural-network

实际上这些是 3 个问题:

我应该使用哪种优化算法来优化多层感知器的权重,如果我知道的话......

1) 只有误差函数的值? (黑盒)

2) 渐变? (一阶导数)

3) 梯度和粗麻布? (二阶导数)

我听说 CMA-ES 对于 1) 应该工作得很好,BFGS 对于 2) 应该工作得很好,但我想知道是否有任何替代方案,但我不知道 3) 应该采用哪种算法。

最佳答案

好的,所以这并不能真正回答您最初提出的问题,但它确实为您在评论中提到的问题提供了解决方案。

处理连续 Action 空间等问题通常不会通过更改错误度量来解决,而是通过更改整个网络的架构来解决。这使您可以继续使用相同的信息丰富的错误信息,同时仍然解决您想要解决的问题。

question 的解决方案中讨论了可以实现此目的的一些可能的架构更改。 .在我看来,我建议使用一种改进的 Q 学习技术,其中状态和 Action 空间都由自组织映射表示,这在上述链接中提到的一篇论文中进行了讨论。

希望对您有所帮助。

关于algorithm - 我应该使用哪种优化算法来优化多层感知器的权重?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7216506/

相关文章:

arrays - 将两个循环合二为一

c++ - 如何提高内联函数效率?

python - 输入形状的卷积神经网络错误

keras - InceptionResnetV2 STEM block keras implementation 与原始论文中的不匹配?

algorithm - 合并两个splay树

c++ - 这2张魔法卡能发挥的最大技能是多少?

Java JIT 和拳击

machine-learning - 什么时候应该运行 wandb.watch 以便权重和偏差正确跟踪参数和梯度?

algorithm - 领袖选举算法

algorithm - 具有因变量的嵌套循环