nlp - 如何使用预训练的词向量创建 gensim word2vec 模型？

标签 nlp gensim word2vec text-analysis word-embedding

我使用分布式 word2vec 算法创建了词向量。现在我有了单词和它们对应的向量。如何使用这些词和向量构建 gensim word2vec 模型？

最佳答案

我不确定您是否使用 gensim 或其他一些工具创建了 word2vec 模型，但如果正确理解您的问题，您只想使用 gensim 加载 word2vec 模型。这是通过以下方式完成的:

import gensim
w2v_file = codecs.open(WORD2VEC_PATH, encoding='utf-8')
model = gensim.models.KeyedVectors.load_word2vec_format(w2v_file, binary=True)  # or binary=False if the model is not compressed

但是，如果您想做的是纯粹使用 gensim 从头开始(即从原始文本)训练 word2vec 模型，这里是 tutorial on how to train word2vec model using gensim .

关于nlp - 如何使用预训练的词向量创建 gensim word2vec 模型？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46701173/

上一篇：linq - 如果我不向数据库插入数据，则在重新启动时获取 SqlCeException

下一篇：wpf - 当今 WPF 中业务应用的发展趋势

machine-learning - 如何从 Fastai 学习器语言模型中的编码器获取句子嵌入

nlp - 余弦相似度涉及嵌入，我们是否必须嵌入整个句子/文本？

python - 如何在 python 中使用 gensim 和 word2vec 查找语义相似性

python - node2vec 支持负边权重吗？

javascript - 如何在javascript中动态构建json数组

python - 如何在gensim中使用similarities.Similarity？

gensim - 如何从 gensim Doc2Vec 获取词向量？

python - Doc2vec 和 word2vec 负采样

machine-learning - 词嵌入模型