我有基于客户在商店停留时间的数据。商店有4个区域;区域 1、2、3 和 4。现在,每 2 分钟,我就会根据他所在的区域获取他的读数 10 个数字。EX:
1-1-1-1-1-1-1-1-3-3-2
4-4-3-3-3-3-3-2-1-3-3
3-4-1-2-2-3-1-4-2-1-4
基本上,我预计大多数客户都位于特定区域,并且他们会相应地聚集在一起。因此,在第一个序列中,客户似乎更喜欢区域 1,接下来是区域 3,最后一个就像噪音。
我向程序提供的只是一堆序列(未标记)。如何生成一个距离/相异矩阵来计算 Python 中每个序列之间的距离?
最佳答案
经过一番挖掘,我发现了 python 中的 textdistance 库。
https://pypi.org/project/textdistance/
即使我的输入是整数序列,它似乎也能很好地解决这个问题。
关于python - Python中基于字符串/整数序列的聚类和距离/相异矩阵,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57844075/