algorithm - 考虑 "belongingness"的集群相似曲线?

标签 algorithm cluster-analysis similarity

目前,我有 6 条曲线,以 6 种不同的颜色显示,如下所示。 enter image description here 这 6 条曲线实际上是由 一个相同实验 的 6 次试验生成的。这意味着,理想情况下它们应该是相同的曲线,但由于噪声和不同的试验参与者,它们看起来只是相似但不完全相同。

现在我想创建一种算法,能够识别 6 条曲线本质上相同,并将它们聚类到一个聚类中。 我应该使用什么相似性指标?

注意:

  1. x 轴根本重要!我只是为了视觉目的将它们对齐在一起。因此,如果这样做有帮助,请随意左/右移动曲线。
  2. 作为曲线一部分的“子曲线”可能会出现。 “归属感”很重要,因此也需要识别。但同样,允许左/右移动。

我尝试学习了一些聚类算法,例如DBSCAN、K-means、Fuzzy C-means等。但我看不出它们在这种情况下是否合适,因为“归属感”需要被发现!

欢迎提出任何建议或意见。我知道很难对这个问题给出一些确切的解决方案。我只期待这里有一些启发性的建议。

最佳答案

查看时间序列相似性函数,例如动态时间扭曲。

它们可以与例如DBSCAN 但不使用 k-means(您无法为这些距离计算合理的“平均值”;k-means 实际上是为平方欧氏距离设计的)。

关于algorithm - 考虑 "belongingness"的集群相似曲线?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18848838/

相关文章:

algorithm - A* 与最长路径中的树

algorithm - 哪种算法返回最短序列以在图的结点之间交换信息?

algorithm - 监督聚类 - 评估每个基本事实标签的指标?

hadoop - 从 pig 中的分组数据生成二元组合

lucene - Solr 常见关键字/短语

algorithm - 餐厅餐 table 分配的数据结构和算法?

c# - 我应该使用什么类型的算法?

python - 使用 sklearn.cluster Kmeans 时出现内存错误

r - 使用聚类分配矩阵为数据分配聚类标签

python - 如何在 WordNet 中找到两个同义词集之间的语义关系