python - Python中基于字符串/整数序列的聚类和距离/相异矩阵

我有基于客户在商店停留时间的数据。商店有4个区域；区域 1、2、3 和 4。现在，每 2 分钟，我就会根据他所在的区域获取他的读数 10 个数字。EX:

1-1-1-1-1-1-1-1-3-3-2
4-4-3-3-3-3-3-2-1-3-3
3-4-1-2-2-3-1-4-2-1-4

基本上，我预计大多数客户都位于特定区域，并且他们会相应地聚集在一起。因此，在第一个序列中，客户似乎更喜欢区域 1，接下来是区域 3，最后一个就像噪音。

我向程序提供的只是一堆序列(未标记)。如何生成一个距离/相异矩阵来计算 Python 中每个序列之间的距离？

最佳答案

经过一番挖掘，我发现了 python 中的 textdistance 库。

即使我的输入是整数序列，它似乎也能很好地解决这个问题。

关于python - Python中基于字符串/整数序列的聚类和距离/相异矩阵，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57844075/

相关文章：

python - 用于多项逻辑回归的 Keras model.predict