artificial-intelligence - Silva 和 Almeida 的反向传播算法中 u 和 d 的最佳值是多少?

标签 artificial-intelligence machine-learning neural-network backpropagation

Silva 和 Almeida 的算法通过为每个权重引入单独的自适应学习率来改进现有的反向传播算法。新学习率的值计算如下:

Learning constant for the next step

我读到常量 ud设置为u > 1d < 1 。这些限制相当广泛,因此是否有任何设置这些值的一般准则,或者我是否必须通过针对我的具体问题进行实验来找出答案?

最佳答案

我读过,适合大多数问题的良好“起始”值是尝试 u = 1.2 和 d = 0.8,但我现在找不到源。

编辑:I found it, PDF page 10-11

另请注意有关如何通过引入动量项来改进算法的评论,如果您还没有的话......

关于artificial-intelligence - Silva 和 Almeida 的反向传播算法中 u 和 d 的最佳值是多少?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8114273/

相关文章:

machine-learning - 神经网络激活函数的选择

artificial-intelligence - 图灵测试的替代方法

machine-learning - 功能和标签有什么区别?

python - 如何以编程方式在python中为caffe生成deploy.txt

python - 感知器学习算法不起作用

r - 从 nnet 包 R cran 绘制神经网络模型

algorithm - 基于 Gomoku 数组的 AI 算法?

machine-learning - 机器学习 - 故意过度拟合数据集

machine-learning - 什么方法最适合对形状不规则的多维数据进行聚类?

machine-learning - 运行协同过滤的 mahout 示例 : where are the results?