python - 使用手套中的训练数据为您的数据集获取词嵌入

标签 python macos nlp

我最近在我的 mac 上安装了 gensim 和 glove,并试图为我拥有的文本数据获取词嵌入。但是,我无法找到适合它的功能。我只遇到过获取两个词之间相似性指标的方法。如何使用库中存在的数据训练手套对象并使用它来获取数据集中单词的嵌入?或者 python 中是否有任何其他库可以执行此操作?谢谢!

最佳答案

实际上,glove 的格式与 word2vec 不同,您可以使用此 https://radimrehurek.com/gensim/scripts/glove2word2vec.html 将 glove 的格式转换为 word2vec 格式

让转换后的手套为glove_changed.txt

导入gensim 模型 = gensim.models.KeyedVectors.load_word2vec_format('glove_changed.txt', binary=False) print(model['cat'])//这将给出单词 'cat' 的词向量

关于python - 使用手套中的训练数据为您的数据集获取词嵌入,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47974626/

相关文章:

cocoa - 如何检测 Cocoa 应用程序是 32 位还是 64 位?

Swift 函数文本字段获得焦点 OSX

java - 如何从 OpenNLP 生成器中提取特征?

python - 使用 Python Spacy 从简单被动语态句子中提取实体

machine-learning - mteval-v13a.pl 和 NLTK BLEU 有什么区别?

python - 在图像上网格以计算平均颜色

python - Mysql 不适用于 python 3.6 和 django 1.9

macos - 尝试从 Go 应用启动终端时出现 "exit status 1"

python - raise Exception, "foo"和 raise Exception ("foo"之间的区别)?

Python:继承内置列表类型VS过滤器、map内置函数