我正在使用 gensim 的 Doc2Vec
函数在 Python 中将文档转换为矢量。
用法示例
model = Doc2Vec(documents, size=100, window=8, min_count=5, workers=4)
我应该如何解释 size
参数。我知道如果我设置 size = 100
,输出向量的长度将是 100,但这是什么意思?例如,如果我将 size
增加到 200,有什么区别?
最佳答案
Word2Vec 捕获一个词的分布式表示,这本质上意味着,多个神经元捕获一个概念(概念可以是词义/情感/词性等),以及 单个神经元对多个概念有贡献。
这些概念是自动学习的,而不是预先定义的,因此您可以将它们视为潜在/隐藏的。同样出于同样的原因,词向量可以用于多种应用。
大小参数越多,神经网络表示这些概念的能力就越大,但训练这些向量需要更多数据(因为它们是随机初始化的)。在句子数量/计算能力不足的情况下,最好保持 size
较小。
Doc2Vec与 Word2Vec 相比,其神经网络架构略有不同,但 size
的含义是类似的。
关于python - 我应该如何解释 gensim 的 Doc2Vec 函数中的 "size"参数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34948650/