我是第一次试用 Gensim,现在有一个问题。我用准备好的文件语料库训练了一个 LSI 模型。我的问题是,我如何知道新文档是否与我从文档语料库生成的模型相似。我不想像 MatrixSimilarity 那样知道文档与我语料库中每个文档的相似性,而是想知道文档是否与我的主题/模型相似。
最佳答案
我认为您应该对新文档进行 LSI,然后计算主题之间的相似性,请参阅此。 https://stats.stackexchange.com/questions/271359/using-lda-to-calculate-similarity/271368
关于python - Doc2Vec Gensim 文档和主题之间的相似性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40564790/