nlp - 如何使用预训练的词向量创建 gensim word2vec 模型?

标签 nlp gensim word2vec text-analysis word-embedding

我使用分布式 word2vec 算法创建了词向量。现在我有了单词和它们对应的向量。如何使用这些词和向量构建 gensim word2vec 模型?

最佳答案

我不确定您是否使用 gensim 或其他一些工具创建了 word2vec 模型,但如果正确理解您的问题,您只想使用 gensim 加载 word2vec 模型。这是通过以下方式完成的:

import gensim
w2v_file = codecs.open(WORD2VEC_PATH, encoding='utf-8')
model = gensim.models.KeyedVectors.load_word2vec_format(w2v_file, binary=True)  # or binary=False if the model is not compressed

但是,如果您想做的是纯粹使用 gensim 从头开始​​(即从原始文本)训练 word2vec 模型,这里是 tutorial on how to train word2vec model using gensim .

关于nlp - 如何使用预训练的词向量创建 gensim word2vec 模型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46701173/

相关文章:

machine-learning - 除了 NER 基本模型之外,添加自定义实体

machine-learning - 如何从 Fastai 学习器语言模型中的编码器获取句子嵌入

nlp - 余弦相似度涉及嵌入,我们是否必须嵌入整个句子/文本?

python - 如何在 python 中使用 gensim 和 word2vec 查找语义相似性

python - node2vec 支持负边权重吗?

javascript - 如何在javascript中动态构建json数组

python - 如何在gensim中使用similarities.Similarity?

gensim - 如何从 gensim Doc2Vec 获取词向量?

python - Doc2vec 和 word2vec 负采样

machine-learning - 词嵌入模型