machine-learning - 如何解释SoftMax回归中的 "soft"和 "max"？

我知道softmax回归的形式，但我很好奇它为什么有这样的名字？或者只是出于某些历史原因？

最佳答案

两个数字的最大值 max(x,y) 可能具有尖角/陡峭边缘，这有时是不需要的属性(例如，如果您想计算梯度)。

要柔化 max(x,y) 的边缘，可以使用一种具有较软边缘的变体:softmax 函数。它的核心仍然是一个 max 函数(嗯，准确地说，它是它的近似值)，但经过了平滑处理。

如果还是不清楚，here's一本好书。

关于machine-learning - 如何解释SoftMax回归中的 "soft"和 "max"？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30637909/