这更多的是一个理论问题:
您知道任何不需要任何输入参数(例如簇数或邻域大小等)的聚类算法(平面或分层)吗?换句话说,您只需将数据作为输入提供给算法并获取集群作为输出。
如果就相关论文/文档提供建议,我将很高兴。
最佳答案
自动确定簇的数量确实是一个仍然被认为是开放研究问题的难题。
最先进的聚类技术之一是将数据建模为狄利克雷过程混合,请参阅 Bayesian Hierarchical Clustering ,但这并不是微不足道的,需要扎实的贝叶斯方法背景和马尔可夫链蒙特卡罗 (MCMC) 估计。
该方法可以自动估计簇的数量。
关于parameters - 没有输入参数的聚类数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14756340/