r - R中hclust使用的聚类算法是什么?

标签 r algorithm machine-learning hierarchical-clustering

我一直在使用hclust算法,这里是代码:

hc = hclust(dist(mydata))
## tweeking some parameters for plotting a dendrogram
# set background color
op = par(bg="#DDE3CA")
# plot dendrogram
plot(hc, col="#487AA1", col.main="#45ADA8", col.lab="#7C8071",
     col.axis="#F38630", lwd=3, lty=3, sub='', hang=-1, axes=FALSE)
# add axis
axis(side=2, at=seq(0, 400, 100), col="#F38630",
     labels=FALSE, lwd=2)
# add text in margin
mtext(seq(0, 400, 100), side=2, at=seq(0, 400, 100),
      line=1, col="#A38630", las=2)
par(op)

当我想以编程方式实现它时,hclust 使用了哪些聚类变体?是否与维基百科上的实现相同:http://en.wikipedia.org/wiki/Hierarchical_clustering

最佳答案

hclust 实现基于 Fionn Murtagh 的 Fortran 代码。它存放在 statlib 中:http://lib.stat.cmu.edu/S/multiv .所有的方法都在他的手稿“Multivariate Data Analysis with Fortan, C and Java Code”中有描述,你可以找到它here .还有他的资源网站http://www.classification-society.org/csna/mda-sw/是一个很好的起点。希望这会有所帮助。

关于r - R中hclust使用的聚类算法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20165855/

相关文章:

machine-learning - 神经网络字符识别

regex - 删除最后一次出现的字符

algorithm - 给定文本的情感分析

javascript - HTML class = Ajax action,如何让点击的类调用好的action?

algorithm - 汉诺塔的替代简单英语算法

python - 如何在 Python 中生成与给定数据集相关的随机数

python - “DNN”对象在 ImageDataGenerator() 中没有属性 'fit_generator' - keras - python

python - Python 中是否有等同于 R apply 函数的函数?

r - 如何添加水平线显示ggplot2中所有组的平均值?

r - 基于其他列变量的 R 长格式行之间的差异