python - gensim Word2vec 迁移学习(来自非 gensim 模型)

标签 python word2vec gensim

我有一组用神经网络训练的嵌入,与 gensim 的 word2vec 无关。

我想使用这些嵌入作为 gensim.Word2vec 中的初始权重。

现在我看到的是,我可以model.load(SOME_MODEL)然后继续训练,但它需要 gensim 模型作为输入。另外 reset_from() 似乎只接受其他 gensim 模型。 但就我而言,我没有 gensim 模型可以开始,而是有一个嵌入的 word2vec 格式的文本文件。

那么如何开始将学习从 word2vec 文本文件转移到 gensim.Word2vec

最佳答案

您可以使用原始Word2Vec模型的键向量格式加载其他模型

import io

from gensim.models.keyedvectors import KeyedVectors

# first line is vocab size and vector dim
model_buf = io.StringIO("""
2 3
word0 -0.000737 -0.002106 0.001851
word1 -0.000878 -0.002106 0.002834
""".lstrip())

model = KeyedVectors.load_word2vec_format(model_buf, binary=False)

model['word0']

关于python - gensim Word2vec 迁移学习(来自非 gensim 模型),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47959639/

相关文章:

python - 替代 numpy.argwhere 以加速 python 中的循环

python - 提高python算法的速度

python - 如何使用 Gensim 加载 Word2vec 而不会出现 AttributeError?

python - 使用 win32com 设置属性

python - 将大图像保存在另一个线程中

python - django request.user.is_authenticated 总是正确的吗?

nlp - 使用 word2vec 时删除停用词

python - Gensim LDA 多核 Python 脚本运行速度太慢

python - Gensim Doc2Vec - 将语料库句子传递给 Doc2Vec 函数

python - 使用 DBSCAN 聚类 word2vec 输出的故障排除技巧