我正在尝试生成 Word2vec 向量。
我有 Pandas 数据框。
我把它变成了代币。
df[" token "]
使用 gensim.models 中的 Word2vec
model = w2v.Word2Vec(
sentences=df["token"],
seed=seed,
workers=num_workers,
size=num_features,
min_count=min_word_count,
window=context_size,
sample=downsampling
)
我现在如何转换我的数据框 df?
这相当于做
model.transform(df)
最佳答案
如果你的数据框只由单词组成,你可以做
df['new_column'] = model[df['words']]
model['word']
或 model[list()]
两者都为您提供了 word
的矢量表示或者你的 list
关于python - 如何在 Python 中生成 Word2vec 向量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50373248/