python - 如何通过 gensim 将训练集的分布保存在经过训练的 LDA 模型上？

代码的最后部分:

lda = models.LdaModel(corpus_tfidf, id2word = dic, num_topics = 64)
corpus_lda = lda[corpus_tfidf]

我想知道如何保存corpus_lda以供进一步使用？

最佳答案

Gensim 具有将语料库写入磁盘的功能:

from Gensim import corpora
corpora.MmCorpus.serialize('pathandfilename.mm', corpus_lda)

要加载已保存的语料库，请使用:

corpus_lda = corpora.MmCorpus('pathandfilename.mm')

还有类似的保存模型的功能(查看教程或 references )。有不同的语料库格式可用，我相信矩阵市场曾经是 Gensim 使用的标准格式，但最近添加了索引语料库格式，它具有一些附加功能(索引，正如您可能已经猜到的那样)。

关于python - 如何通过 gensim 将训练集的分布保存在经过训练的 LDA 模型上？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27354912/