machine-learning - 简单感知器模型和 XOR

抱歉，我只是在这里问。我也会努力学习，准备回答问题!

许多论文和文章声称 MLP 激活函数的选择没有限制。

似乎只需要考虑哪一个最适合给定的条件。

而且文章还说，数学证明简单的感知器无法解决异或问题。

我知道简单的感知器模型过去使用阶跃函数作为其激活函数。

但是如果基本上使用哪个激活函数并不重要，那么使用

f(x)=1 if |x-a|<b 
f(x)=0 if |x-a|>b

作为激活函数，可以解决异或问题。 (对于2输入1输出无隐藏层感知器模型)

我知道使用人工函数不利于学习模型。但如果它无论如何都有效，那么为什么文章说它已被证明无效？

这篇文章是否意味着使用阶跃函数的简单感知器模型？或者简单感知器的激活函数是否必须是阶跃函数(与 MLP 不同)？还是我错了？

最佳答案

一般来说，问题在于不可微的激活函数(如您提出的函数)不能用于反向传播和其他技术。反向传播是估计正确阈值(示例中的 a 和 b)的便捷方法。选择所有流行的激活函数，使其近似步进行为，同时保持可微分。

关于machine-learning - 简单感知器模型和 XOR，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24301905/