Silva 和 Almeida 的算法通过为每个权重引入单独的自适应学习率来改进现有的反向传播算法。新学习率的值计算如下:
我读到常量 u
和d
设置为u > 1
和d < 1
。这些限制相当广泛,因此是否有任何设置这些值的一般准则,或者我是否必须通过针对我的具体问题进行实验来找出答案?
最佳答案
我读过,适合大多数问题的良好“起始”值是尝试 u = 1.2 和 d = 0.8,但我现在找不到源。
另请注意有关如何通过引入动量项来改进算法的评论,如果您还没有的话......
关于artificial-intelligence - Silva 和 Almeida 的反向传播算法中 u 和 d 的最佳值是多少?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8114273/