我有一个项目-项目矩阵 (1877 x 1877)。矩阵中的值表示两个项目同时出现的次数。如何确定两个项目之间的相似性? 通过阅读,我发现几乎没有选择。但是我不确定这些方法。感谢任何开始的输入。
- 使用余弦计算两个向量之间的 sim
- 将其转换成图表,使用 simrank 等度量来计算相似度 - 可以使用出现次数作为两个节点之间的权重。
最佳答案
我建议使用 spatial cosine similarity .或者你可以计算 jaccard's similarity对于每个项目对。
在计算出任一相似性矩阵(亲和矩阵)后,您可以使用光谱(或空间)聚类算法,例如 sklearn's spectral clustering对这些项目进行分组的算法。
关于python - 如何基于共现矩阵计算相似度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41974321/