我有一组用神经网络训练的嵌入,与 gensim 的 word2vec 无关。
我想使用这些嵌入作为 gensim.Word2vec
中的初始权重。
现在我看到的是,我可以model.load(SOME_MODEL)
然后继续训练,但它需要 gensim 模型作为输入。另外 reset_from()
似乎只接受其他 gensim 模型。
但就我而言,我没有 gensim 模型可以开始,而是有一个嵌入的 word2vec 格式的文本文件。
那么如何开始将学习从 word2vec 文本文件转移到 gensim.Word2vec
?
最佳答案
您可以使用原始Word2Vec模型的键向量格式加载其他模型
import io
from gensim.models.keyedvectors import KeyedVectors
# first line is vocab size and vector dim
model_buf = io.StringIO("""
2 3
word0 -0.000737 -0.002106 0.001851
word1 -0.000878 -0.002106 0.002834
""".lstrip())
model = KeyedVectors.load_word2vec_format(model_buf, binary=False)
model['word0']
关于python - gensim Word2vec 迁移学习(来自非 gensim 模型),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47959639/