python - Doc2Vec Gensim 文档和主题之间的相似性

标签 python similarity gensim doc2vec

我是第一次试用 Gensim,现在有一个问题。我用准备好的文件语料库训练了一个 LSI 模型。我的问题是,我如何知道新文档是否与我从文档语料库生成的模型相似。我不想像 MatrixSimilarity 那样知道文档与我语料库中每个文档的相似性,而是想知道文档是否与我的主题/模型相似。

最佳答案

我认为您应该对新文档进行 LSI,然后计算主题之间的相似性,请参阅此。 https://stats.stackexchange.com/questions/271359/using-lda-to-calculate-similarity/271368

关于python - Doc2Vec Gensim 文档和主题之间的相似性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40564790/

相关文章:

machine-learning - 如何在新闻文章中使用 gensim 进行 lda?

python - 合并 Pandas 数据帧行

python - 在 forms.py 中使用请求对象

python - 如何调整典型sk-learn数据挖掘方法的阈值以平衡精度和召回率?

sql - 快速最近邻搜索

image - k-最近邻 VS 相似性搜索

nlp - "pre-built"用于潜在语义分析的矩阵

javascript - Python/Javascript 数字精度

similarity - 使用余弦相似度测量的 n 元句子相似度

python-2.7 - 尝试使用 gensim word2vec 时使用 a.all() 或 a.any() 错误