artificial-intelligence - 关于聚类方法的问题

标签 artificial-intelligence machine-learning data-mining neural-network

最近我开始研究数据挖掘中的聚类,研究了顺序聚类、层次聚类和 k-means。

我还读到过一篇将k-means与其他两种聚类技术区分开来的说法,说k-means不太擅长处理名义属性,但文中没有解释这一点。到目前为止,唯一的我可以看到的区别是,对于 K 均值,我们会提前知道我们将需要恰好 K 个聚类,而我们不知道其他两种聚类方法需要多少个聚类。

那么有人可以给我一些关于为什么存在这样的陈述的想法吗,即,k-means 在处理标称属性的示例时存在这个问题,有没有办法克服这个问题?

提前致谢。

最佳答案

k-means 算法通过取簇中所有点的平均值来计算簇质心。如果参数是名义参数,则不能取平均值。

有时,可以将标称值放入某种顺序中,然后映射到实际值。例如,一周中的几天可以映射到范围 [1.0 - 7.0],但有时这是不可能的,例如具有值 [Windows、Linux、OSX] 的属性。

关于artificial-intelligence - 关于聚类方法的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4098581/

相关文章:

python - 在 Windows 上使用命令 "sudo apt-get install openblas-dev"?

python - sklearn 上的逻辑回归函数

optimization - 具有非常大的 λ 的正则化成本函数

r - 使用 ctree 显示每个节点的体积,在 R 中绘图

python - 将经过训练的 Tensorflow 模型保存到另一台机器上进行推理

python - 如何使用 python 找到一个好的分散 key 的方法

python - 为什么我的训练损失在使用预先训练的权重训练 AlexNet 最后一层时会出现振荡?

pattern-matching - 封闭式和开放式顺序模式挖掘算法的区别

java - 对人物相似度算法的建议

nlp - Dialogflow 无法识别训练短语中的名称