我正在训练 mahout 分类器。我是否需要对训练数据进行词干提取、小写和停用词删除,或者 mahout 会在训练过程中处理此问题。下面的命令是我用于训练的。
$MAHOUT_HOME/bin/mahout trainclassifier -i category-training-data -o category-bayes-model -type bayes -ng 1 -source hdfs
最佳答案
它不进行此类预处理,不。
关于machine-learning - Mahout 分类器训练数据的预处理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15540276/