r - 自组织 map 可视化结果解释

标签 r machine-learning cluster-analysis som unsupervised-learning

使用 R Kohonen包中,我获得了一个“代码”图,其中显示了代码本向量。

codes plot

我想问一下,相邻节点的码本向量不是应该相似吗?为什么左侧最上面的 2 个节点差异如此之大?

有没有办法将其组织成有意义的组织,如下图所示?来源 here 。高度贫困国家集中在底部。 world poverty map

library("kohonen")

data("wines")
wines.sc <- scale(wines)
set.seed(7)
wine.som <- som(data = wines.sc, grid = somgrid(5, 4, "hexagonal"))

# types of plots

plot(wine.som, type="codes", main = "Wine data")

最佳答案

图 1 是每个节点的平均向量结果。您突出显示的前 2 个节点非常相似。

Map 2是一种节点之间的相似度索引。

如果您想使用 map 1 结果获得此类 map ,您可能必须使用以下参数开发自己的绘图函数:

  1. 选取最相关的节点或最不同的节点(手动或自动)。然后,您必须为每个节点指定颜色。

  2. 使用每个节点中心与所选节点之间的平均距离为相邻节点指定颜色。较短的距离 = 接近的颜色,较长的距离 = 褪色。

总而言之,这是一项几乎没有任何成果的大量工作。 map 1比较好,包含很多信息。 map 2很好看...

关于r - 自组织 map 可视化结果解释,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30368564/

相关文章:

python - 如何在图像上应用word2vec?

r - downloadButton/downloadHandler无法识别文件名参数

r - 您可以在新环境中运行 Sweave 吗?

machine-learning - 确定神经网络内的参数总数

machine-learning - 在 H2O 中使用分类变量的最佳实践?

r - hclust 大小限制?

c++ - 使用 OpenCV 的 Kmeans 聚类中的马哈拉诺比斯距离

r - 在R中删除String中的重复元素

r - 根据 R 中的日期通过线性插值进行数据插补

cluster-analysis - k-均值聚类误差会增加吗?