python - 在Python中计算稀疏张量的余弦相似度的有效方法?

标签 python machine-learning nlp word2vec tensor

我有一个单位张量(长度= 1)列表。该列表包含 ~20 000 这样的张量。张量具有 ~3 000 维度,但非常稀疏。只有 x (0 < x < 1) 维度不是 0。我需要计算所有这些张量之间的余弦相似度。最有效的方法是什么? (这不是 NLP 任务,但我的解决方案看起来类似于 word2Vect 方法,这就是我添加 NLP 标签的原因。我的张量比 word2vec 具有更多维度,并且它更加稀疏)

最佳答案

请参阅以下网站了解 sklearn cosine_similarity 函数

http://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise.cosine_similarity.html

在Python中

from sklearn.metrics.pairwise import cosine_similarity
cos_sim = cosine_similarity(vector1,vector2)

关于python - 在Python中计算稀疏张量的余弦相似度的有效方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44887406/

相关文章:

java - java中的停用词和词干分析器

python - 使用 python 脚本从数据库中选择值时,行数始终打印为 -1

python - 有没有办法获取shell :appsfolder on Windows 10?的完整路径

python - 从子目录中的不同文件导入类

machine-learning - 使用朴素贝叶斯获取类别概率

python - 值错误: Unexpected character found when decoding 'true' while converting IOB to JSONL for SpaCy

python - 无法导入 Beautiful Soup

r - 从数据帧创建稀疏矩阵

python - 带有参数的 Tensorflow serving_input_receiver_fn

python - 在 Tensorflow 2.0/Keras 中使用其他数据功能创建文本分类器