代码的最后部分:
lda = models.LdaModel(corpus_tfidf, id2word = dic, num_topics = 64)
corpus_lda = lda[corpus_tfidf]
我想知道如何保存corpus_lda以供进一步使用?
最佳答案
Gensim 具有将语料库写入磁盘的功能:
from Gensim import corpora
corpora.MmCorpus.serialize('pathandfilename.mm', corpus_lda)
要加载已保存的语料库,请使用:
corpus_lda = corpora.MmCorpus('pathandfilename.mm')
还有类似的保存模型的功能(查看教程或 references )。 有不同的语料库格式可用,我相信矩阵市场曾经是 Gensim 使用的标准格式,但最近添加了索引语料库格式,它具有一些附加功能(索引,正如您可能已经猜到的那样)。
关于python - 如何通过 gensim 将训练集的分布保存在经过训练的 LDA 模型上?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27354912/