python - 从未经训练的数据集中为 doc2vec 中的句子构建向量

我有一个根据我的数据构建的 doc2vec 模型，现在我在运行时有一个不属于训练数据集的新句子。

如何从我的模型中构建或预测这句话的向量？

我该如何处理这句话中的生词？

最佳答案

Gensim(开发版)似乎有一种推断新句子向量的方法。查看 https://github.com/gojomo/gensim/blob/develop/gensim/models/doc2vec.py 中的 model.infer_vector(NewDocument) 方法

关于python - 从未经训练的数据集中为 doc2vec 中的句子构建向量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32796485/

相关文章：

python - 使用 DBSCAN 找到最密集的集群？