我一直在使用hclust算法,这里是代码:
hc = hclust(dist(mydata))
## tweeking some parameters for plotting a dendrogram
# set background color
op = par(bg="#DDE3CA")
# plot dendrogram
plot(hc, col="#487AA1", col.main="#45ADA8", col.lab="#7C8071",
col.axis="#F38630", lwd=3, lty=3, sub='', hang=-1, axes=FALSE)
# add axis
axis(side=2, at=seq(0, 400, 100), col="#F38630",
labels=FALSE, lwd=2)
# add text in margin
mtext(seq(0, 400, 100), side=2, at=seq(0, 400, 100),
line=1, col="#A38630", las=2)
par(op)
当我想以编程方式实现它时,hclust 使用了哪些聚类变体?是否与维基百科上的实现相同:http://en.wikipedia.org/wiki/Hierarchical_clustering ?
最佳答案
hclust
实现基于 Fionn Murtagh 的 Fortran 代码。它存放在 statlib 中:http://lib.stat.cmu.edu/S/multiv .所有的方法都在他的手稿“Multivariate Data Analysis with Fortan, C and Java Code”中有描述,你可以找到它here .还有他的资源网站http://www.classification-society.org/csna/mda-sw/是一个很好的起点。希望这会有所帮助。
关于r - R中hclust使用的聚类算法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20165855/