python - 我应该如何解释 gensim 的 Doc2Vec 函数中的 "size"参数?

标签 python gensim word2vec

我正在使用 gensimDoc2Vec 函数在 Python 中将文档转换为矢量。

用法示例

model = Doc2Vec(documents, size=100, window=8, min_count=5, workers=4)

我应该如何解释 size 参数。我知道如果我设置 size = 100,输出向量的长度将是 100,但这是什么意思?例如,如果我将 size 增加到 200,有什么区别?

最佳答案

Word2Vec 捕获一个词的分布式表示,这本质上意味着,多个神经元捕获一个概念(概念可以是词义/情感/词性等),以及 单个神经元对多个概念有贡献

这些概念是自动学习的,而不是预先定义的,因此您可以将它们视为潜在/隐藏的。同样出于同样的原因,词向量可以用于多种应用。

大小参数越多,神经网络表示这些概念的能力就越大,但训练这些向量需要更多数据(因为它们是随机初始化的)。在句子数量/计算能力不足的情况下,最好保持 size 较小。

Doc2Vec与 Word2Vec 相比,其神经网络架构略有不同,但 size 的含义是类似的。

关于python - 我应该如何解释 gensim 的 Doc2Vec 函数中的 "size"参数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34948650/

相关文章:

python - ISO 格式的 Pandas 时间戳在导入时导致 Exasol 错误

python - GCloud 命令行从不同帐户执行时出现错误

Python 请求 : Using lists when specifying parameters

python - 使用 DBSCAN 聚类 word2vec 输出的故障排除技巧

python - 如何在sklearn的k-means中检查给定向量的聚类细节

python - 如何删除关于使用 Word2vec gensim\matutils.py :737 的 gensim 警告

python - Matplotlib 饼图标签与值不匹配

python - 使用 Gensim 获取八卦的问题

visualization - 来自gensim的pyLDAvis可视化未在google colab中显示结果

tensorflow - Tensorflow 嵌入层内部的网络结构是什么?