我有一个单位张量(长度= 1)列表。该列表包含 ~20 000 这样的张量。张量具有 ~3 000 维度,但非常稀疏。只有 x (0 < x < 1) 维度不是 0。我需要计算所有这些张量之间的余弦相似度。最有效的方法是什么? (这不是 NLP 任务,但我的解决方案看起来类似于 word2Vect 方法,这就是我添加 NLP 标签的原因。我的张量比 word2vec 具有更多维度,并且它更加稀疏)
最佳答案
请参阅以下网站了解 sklearn cosine_similarity 函数
http://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise.cosine_similarity.html
在Python中
from sklearn.metrics.pairwise import cosine_similarity
cos_sim = cosine_similarity(vector1,vector2)
关于python - 在Python中计算稀疏张量的余弦相似度的有效方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44887406/