machine-learning - bin/mallet 训练主题在每个实例中都会得到不同的结果

标签 machine-learning mallet

当我运行命令时 bin\mallet train-topics --input input.tutorial.mallet --num-topics 40 --num-iterations 100 --optimize-interval 50 --optimize-burn-in 200 --output-state input.gz --输出主题键输入键.txt --输出文档主题输入比例.txt

我在运行该命令的每个实例中都得到不同的结果。

输出:

0 AJAY_DASARI 19 0.062051649928263994 39 0.03263988522238164 35 0.03263988522238164 33 0.03263988522238164 32 0.03263988522 238164 23 0.03263988522238164 ........................ 1 巴尔文德辛 21 0.06297779395704405 36 0.04805242082271569 22 0.04805242082271569 35 0.03312704768838733 32 0.0331270476883873 3 31 0.03312704768838733 30 0.03312704768838733 26 0.03312704768838733 24 0.03312704768838733 15 0.03312704768838733 13 ................

如何每次使用该命令都得到相同的结果

最佳答案

训练模型时,使用选项--random-seed INTEGER(不同于0,否则使用时钟)来修复随机种子。它应该在多次运行中为您提供一致的结果。

此功能存在一个错误,即 now fixed在开发版本中。
请参阅MALLET's download page构建最新版本。

关于machine-learning - bin/mallet 训练主题在每个实例中都会得到不同的结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18050891/

相关文章:

python - Spark 集群上的 GridSearchCV - ImportError : No module named

tensorflow - 如何使用有状态 LSTM 和 batch_size > 1 布置训练数据

python - Tensorflow 中 Theano 的 Theano.tensor.ivector 的等价性

python - 检测图像中的光晕

java - Mallet HMM 训练问题

topic-modeling - 如何在mallet中导入excel文件

machine-learning - 在测试中使用增强数据图像

java - 使用 Java 版 Mallet Api 进行主题建模

java - 使用对数似然比较不同的木槌主题模型?

java - Mallet 文档分类 - 减少词汇量