我有一个 Training.arff 文件,其中每个条目都有 2000 个特征(属性)。我想使用信息增益标准选择这些属性中的前 n 个。如何使用 WEKA 和命令行来做到这一点?我在网上查了一下,似乎这是一个两阶段的过程,因为我必须使用排名器作为第二步。有人可以解释一下我该怎么做吗?
最佳答案
实现方法是这样的:
java weka.filters.supervised.attribute.AttributeSelection \
-E "weka.attributeSelection.InfoGainAttributeEval" \
-S "weka.attributeSelection.Ranker -N 10" -i training.arff -o training_IG.arff
-E 选项是告诉使用哪个类作为评估器,-S 告诉使用什么搜索方法(在本例中是排名)。
关于machine-learning - 如何使用信息增益作为标准选择前 n 个特征,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22262030/