r - 自组织 map 可视化结果解释

标签 r machine-learning cluster-analysis som unsupervised-learning

使用 R Kohonen包中，我获得了一个“代码”图，其中显示了代码本向量。

codes plot

我想问一下，相邻节点的码本向量不是应该相似吗？为什么左侧最上面的 2 个节点差异如此之大？

有没有办法将其组织成有意义的组织，如下图所示？来源 here 。高度贫困国家集中在底部。 world poverty map

library("kohonen")

data("wines")
wines.sc <- scale(wines)
set.seed(7)
wine.som <- som(data = wines.sc, grid = somgrid(5, 4, "hexagonal"))

# types of plots

plot(wine.som, type="codes", main = "Wine data")

最佳答案

图 1 是每个节点的平均向量结果。您突出显示的前 2 个节点非常相似。

Map 2是一种节点之间的相似度索引。

如果您想使用 map 1 结果获得此类 map ，您可能必须使用以下参数开发自己的绘图函数:

选取最相关的节点或最不同的节点(手动或自动)。然后，您必须为每个节点指定颜色。
使用每个节点中心与所选节点之间的平均距离为相邻节点指定颜色。较短的距离 = 接近的颜色，较长的距离 = 褪色。

总而言之，这是一项几乎没有任何成果的大量工作。 map 1比较好，包含很多信息。 map 2很好看...

关于r - 自组织 map 可视化结果解释，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30368564/

上一篇：python - 分类拟合得到ValueError : setting an array element with a sequence

下一篇：matlab - Octave:Kmeans 聚类不适用于图像矩阵

相关文章：

python - 如何在图像上应用word2vec？

r - downloadButton/downloadHandler无法识别文件名参数

r - 您可以在新环境中运行 Sweave 吗？

machine-learning - 确定神经网络内的参数总数

machine-learning - 在 H2O 中使用分类变量的最佳实践？

r - hclust 大小限制？

c++ - 使用 OpenCV 的 Kmeans 聚类中的马哈拉诺比斯距离

r - 在R中删除String中的重复元素

r - 根据 R 中的日期通过线性插值进行数据插补

cluster-analysis - k-均值聚类误差会增加吗？