algorithm - 在 k 均值聚类中最小化损失函数意味着什么?

标签 algorithm cluster-analysis k-means

我正在学习 k-means 聚类算法,并且我读到该算法是“尝试最小化未满足聚类目标的损失函数”。

我理解该算法的基本概念,该算法在第一次迭代中初始化任意质心/均值,然后将数据点分配给这些集群。在所有点分配完毕后,更新质心,并再次重新分配点。该算法继续迭代,直到簇不再发生变化。该算法尝试最小化簇内平方和 (WCSS) 值,该值是簇内方差的度量。

但是,我无法理解该算法中损失函数的含义。任何见解都值得赞赏。

最佳答案

在更广泛的机器学习背景下,loss function (有时称为成本函数)是一个指示特定答案有多“糟糕”的函数。最小化损失函数相当于找到问题的“最佳”答案。

(考虑“损失最少”可能会很奇怪,在这种情况下,将其视为成本函数可能会更容易。目标是找到问题的最低成本解决方案。)

关于algorithm - 在 k 均值聚类中最小化损失函数意味着什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63946886/

相关文章:

string - 为什么朴素的字符串搜索算法更快?

validation - 您如何手动计算 Cluster 的轮廓、内聚和分离

machine-learning - 尝试MOA流聚类算法denstream.WithDBSCAN时出现java.lang.NullPointerException(如何正确使用它?)

matlab - 在 K-Means 算法中使用绝对 PIL 逊相关作为距离 (MATLAB)

cluster-analysis - 使用 Mahout 的 K 均值聚类

algorithm - K-means聚类解的唯一性

python - 寻找最繁忙时段的算法?

algorithm - 是否有没有递归形式的算法特征?

algorithm - Q : Count array pairs with bitwise AND > k ~ better than O(N^2) possible?

r - mutate/tibble 中的自定义函数