python - 如何在python中使用gensim获取相关的匹配词？

我试图在通过处理语料库(文本文件 A)创建 gensim 模型后查找相关词。接下来，我想传递我自己的单词列表(存储的文本文件 B)，以从 gensim 模型中获取与文本文件 B 中最相似的单词。

model = gensim.models.Word2Vec(documents, window=5, min_count=1, workers=10)
model.train(documents, total_examples=len(documents), epochs=10)

w1 = "beautiful"
print(model.wv.most_similar(positive=w1))

这给了我一个与单词“beautiful”相关的前 10 个单词的列表。但是，当我尝试传递我的列表(文本文件 B)时，它出现 key 错误: key 不存在。

mywords = read_med_terms("C:/Users/x/TextfileB.txt")


for word in mywords:
    try:
        print(model.wv.most_similar(positive=word))
    except KeyError:
        continue

如何通过我的列表来获取语料库中可用的相关匹配词集？衷心感谢您的帮助。

最佳答案

问题已经通过像这样使用异常try-except解决了:

relatedwords = []

for word in mywords:
    try:
        similar = model.wv.most_similar(positive=word)
        v = [x[0] for x in similar]
        relatedWords += v
    except:
        continue

关于python - 如何在python中使用gensim获取相关的匹配词？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/66930434/

上一篇：swift - 是否有 Markdown 记录 Swift 中的泛型类型参数？

下一篇：Datajoint LabBook - 如何更改端口

python - 将 Pandas 中的 VARIANT 类型插入 Snowflake

python - GenSim 中具有固定 Eta 的引导 LDA

python - Gensim LDA 中的文档主题分布

algorithm - 优化相似句子的搜索，Word2Vec

neural-network - User2Vec？根据用户使用的文档代表用户

python - 是否可以在 OS X 下的 Python 的 raw_input 中使用 readline 而不是 libedit？

python - 如何通过gensim在LDA分析中删除单词

python-3.x - Gensim Word2Vec : poor training performance.

python - Flask-admin 批处理操作，通过弹出模式窗口进行参数