抱歉,我只是在这里问。我也会努力学习,准备回答问题!
许多论文和文章声称 MLP 激活函数的选择没有限制。
似乎只需要考虑哪一个最适合给定的条件。
而且文章还说,数学证明简单的感知器无法解决异或问题。
我知道简单的感知器模型过去使用阶跃函数作为其激活函数。
但是如果基本上使用哪个激活函数并不重要,那么使用
f(x)=1 if |x-a|<b
f(x)=0 if |x-a|>b
作为激活函数,可以解决异或问题。 (对于2输入1输出无隐藏层感知器模型)
我知道使用人工函数不利于学习模型。但如果它无论如何都有效,那么为什么文章说它已被证明无效?
这篇文章是否意味着使用阶跃函数的简单感知器模型?或者简单感知器的激活函数是否必须是阶跃函数(与 MLP 不同)?还是我错了?
最佳答案
一般来说,
问题在于不可微的激活函数(如您提出的函数)不能用于反向传播和其他技术。反向传播是估计正确阈值(示例中的 a
和 b
)的便捷方法。选择所有流行的激活函数,使其近似步进行为,同时保持可微分。
关于machine-learning - 简单感知器模型和 XOR,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24301905/