hadoop - 正确的Mahout CVB最大迭代次数

标签 hadoop machine-learning mahout lda

从命令行使用mahout cvb时。确定迭代次数的最佳方法是什么?

-x是设置它的参数。
默认值似乎是4(根据其他读数),并且设置的迭代次数越多,结果越准确。但是,如何知道要设置的合适大小?

最佳答案

您尝试了不同的'x'值,并评估了每种情况的主题分类。我将从4和10开始,然后通过二进制搜索运行。

关于hadoop - 正确的Mahout CVB最大迭代次数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22130863/

相关文章:

java - Py4J 的开销比 Jython 和 JPype 大

hadoop - Hive:有条件地截断并加载表

machine-learning - 在 python 中使用修改后的 OneHotEncoder 将分类数据编码为虚拟变量?

hadoop - Apache Mahout-从字符串读取首选项值

python - Tensorflow .pb 文件到 coreml 模型 : 'Unsupported Ops of type: AddV2'

python - 如何强制决策树在评估时仅使用整数

java - 如何在操作书中的 mahout 中运行示例

eclipse - 雅虎 hadoop 教程

hadoop - 为什么我的所有 map 输出记录都没有减少?

hadoop - 如何确定配置单元中的存储桶数