r - 解读phom R包-持久同源-数据拓扑分析-聚类分析

标签 r cluster-analysis topology

我正在学习使用 R 的 pHom 包来分析数据的拓扑。

我想理解(表征)一组数据(矩阵(3500 行,10 列)。为了实现这一目标,R 包 phom 运行描述数据的持久同源测试。

(引用:以下视频描述了我们正在寻求如何利用拓扑中的同源性 - 引用视频 4 分钟: http://www.youtube.com/embed/XfWibrh6stw?rel=0&autoplay=1 )。

使用 R 包“phom”(链接: http://cran.r-project.org/web/packages/phom/phom.pdf )可以运行以下示例。

我需要帮助才能正确理解 phom 函数的工作原理以及如何解释数据(图)。

使用r中phom包引用手册的示例#1,在R上运行

加载包

library(phom)
library(Rccp)

示例 1

x <- runif(100)
y <- runif(100)
points <- t(as.matrix(rbind(x, y)))
max_dim <- 2
max_f <- 0.2
intervals <- pHom(points, max_dim, max_f, metric="manhattan")
plotPersistenceDiagram(intervals, max_dim, max_f,
title="Random Points in Cube with l_1 Norm")

如果有人能够帮助我,我将不胜感激:

问题: a.) max_f 值的含义是什么以及它来自哪里?根据我的数据?我设置它们? b.) 绘图:plotPersistenceDiagram(如果您在 R 中运行示例,您将看到绘图),我该如何解释它?

谢谢。

注意:为了运行“phom”包,您需要“Rccp”包并且需要最新版本的 R 3.03。

前面的示例是在分别加载“phom”和“Rccp”包后在 R 中完成的。

最佳答案

这个问题完全是错误的地方,但以防万一一年后你仍然在为此苦苦挣扎,我碰巧知道答案。

计算持久同源性有两个步骤:

  1. 将点云转化为单纯复形的过滤
  2. 计算单纯复形的同源性

第 1 步的“过滤”部分意味着您必须计算整个参数范围的单纯复形。本例中的参数是 epsilon,即连接点的距离阈值。 max_f 变量将 epsilon 扫描的范围限制为从零到 max_f

plotPersistenceDiagram 将同源“持久性条形码”显示为点而不是线。该点的 x 坐标是该拓扑特征的诞生时间(它第一次出现的 epsilon 值),y 坐标是死亡时间(它消失的 epsilon 值)。

关于r - 解读phom R包-持久同源-数据拓扑分析-聚类分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22703475/

相关文章:

r - 如何改变 igraph 中节点的外观?

cluster-analysis - 命令行使用Weka生成集群分配arff文件

python - 拓扑排序,递归,使用生成器

r - 在ggplot中绘制两组多条垂直线

r - R中的尾递归

python - 散点图按颜色分隔簇 matplotlib python

python - 聚类结构 3D 数据

javascript - 三.js/jsCAD : how to smooth a mesh normals for an outline effect?

hadoop - Hadoop中的 Rack 拓扑

r - 在非线性优化函数 `nloptr` 中传递参数