我最近在我的 mac 上安装了 gensim 和 glove,并试图为我拥有的文本数据获取词嵌入。但是,我无法找到适合它的功能。我只遇到过获取两个词之间相似性指标的方法。如何使用库中存在的数据训练手套对象并使用它来获取数据集中单词的嵌入?或者 python 中是否有任何其他库可以执行此操作?谢谢!
最佳答案
实际上,glove 的格式与 word2vec 不同,您可以使用此 https://radimrehurek.com/gensim/scripts/glove2word2vec.html 将 glove 的格式转换为 word2vec 格式
让转换后的手套为glove_changed.txt
导入gensim
模型 = gensim.models.KeyedVectors.load_word2vec_format('glove_changed.txt', binary=False)
print(model['cat'])//这将给出单词 'cat' 的词向量
关于python - 使用手套中的训练数据为您的数据集获取词嵌入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47974626/