python - 如何在 Python 中生成 Word2vec 向量?

标签 python neural-network nlp text-mining word2vec

我正在尝试生成 Word2vec 向量。

我有 Pandas 数据框。

我把它变成了代币。

df[" token "]

使用 gensim.models 中的 Word2vec

model = w2v.Word2Vec(
sentences=df["token"],
seed=seed,
workers=num_workers,
size=num_features,
min_count=min_word_count,
window=context_size,
sample=downsampling
)

我现在如何转换我的数据框 df?

这相当于做

model.transform(df)

最佳答案

如果你的数据框只由单词组成,你可以做

df['new_column'] = model[df['words']]

model['word']model[list()]两者都为您提供了 word 的矢量表示或者你的 list

关于python - 如何在 Python 中生成 Word2vec 向量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50373248/

相关文章:

python - 如何访问图中特定顶点的名称(python-igraph)

python - Celerybeat 不执行周期性任务

tensorflow - 类似 MNIST 的问题。卷积神经网络

python - 塑造神经网络分类输出维度?

python - 在 python 中按数据框分组并在多列上连接字符串

algorithm - 具有相关特征的神经网络

machine-learning - 用于预测文本的二元模型

python - 在 keras Tokenizer 中使用 tf–idf

java - 限制 Java 方法调用的 CPU/堆栈?

python - 在 Python 中,将文本转换为 Zip 转换为 base64,反之亦然