python - 我应该如何解释 gensim 的 Doc2Vec 函数中的 "size"参数？

我正在使用 gensim 的 Doc2Vec 函数在 Python 中将文档转换为矢量。

用法示例

model = Doc2Vec(documents, size=100, window=8, min_count=5, workers=4)

我应该如何解释 size 参数。我知道如果我设置 size = 100，输出向量的长度将是 100，但这是什么意思？例如，如果我将 size 增加到 200，有什么区别？

最佳答案

Word2Vec 捕获一个词的分布式表示，这本质上意味着，多个神经元捕获一个概念(概念可以是词义/情感/词性等)，以及 单个神经元对多个概念有贡献。

这些概念是自动学习的，而不是预先定义的，因此您可以将它们视为潜在/隐藏的。同样出于同样的原因，词向量可以用于多种应用。

大小参数越多，神经网络表示这些概念的能力就越大，但训练这些向量需要更多数据(因为它们是随机初始化的)。在句子数量/计算能力不足的情况下，最好保持 size 较小。

Doc2Vec与 Word2Vec 相比，其神经网络架构略有不同，但 size 的含义是类似的。

关于python - 我应该如何解释 gensim 的 Doc2Vec 函数中的 "size"参数？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34948650/