python - Gensim:如何使用以前的 word2vec 模型重新训练 doc2vec 模型

标签 python nlp gensim word2vec doc2vec

通过 Doc2Vec 建模,我训练了一个模型并保存了以下文件:

1. model
2. model.docvecs.doctag_syn0.npy
3. model.syn0.npy
4. model.syn1.npy
5. model.syn1neg.npy

但是,我有一种新的方法来标记文档,并想再次训练模型。因为词向量已经从之前的版本中获得。有什么方法可以重用该模型(例如,将之前的 w2v 结果作为训练的初始向量)?有人知道该怎么做吗?

最佳答案

我发现,我们可以加载模型并继续训练。

model = Doc2Vec.load("old_model")
model.train(sentences)

关于python - Gensim:如何使用以前的 word2vec 模型重新训练 doc2vec 模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39252207/

相关文章:

java - 可以推荐哪种语言用于文本挖掘/解析?

r - 使用 R 进行荷兰语情感分析

python - 如何结合doc2vec的PV-DM和PV-DBOW方法生成的向量?

machine-learning - 使用 gensim 构建的 doc2vec 模型的 GridSearch

python - Buildozer 错误 : "ios.codesign.debug" key missing, 您必须提供证书名称才能使用

python - 当 uwsgi 重新加载到 flask 中时保留全局数据

python - 字符串里面有字符串

python - 将包含用于 Python 变量赋值的文本的字符串转换为实际变量

python - 如何标记 NLTK 中的字符串句子?

python - Gensim Word2vec : Semantic Similarity