machine-learning - 如何使用信息增益作为标准选择前 n 个特征

标签 machine-learning weka feature-selection

我有一个 Training.arff 文件,其中每个条目都有 2000 个特征(属性)。我想使用信息增益标准选择这些属性中的前 n 个。如何使用 WEKA 和命令行来做到这一点?我在网上查了一下,似乎这是一个两阶段的过程,因为我必须使用排名器作为第二步。有人可以解释一下我该怎么做吗?

最佳答案

实现方法是这样的:

java weka.filters.supervised.attribute.AttributeSelection \
-E "weka.attributeSelection.InfoGainAttributeEval" \
-S "weka.attributeSelection.Ranker -N 10" -i training.arff -o training_IG.arff

-E 选项是告诉使用哪个类作为评估器,-S 告诉使用什么搜索方法(在本例中是排名)。

关于machine-learning - 如何使用信息增益作为标准选择前 n 个特征,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22262030/

相关文章:

python - 如何为非常相似的代码片段编写方法或 for 循环

python - 尝试对用户输入数据进行标签编码时出现类型错误

python - Sklearn特征选择

python - 如何在 scikit-learn 中使用随机 Logistic 回归找到最低的正则化参数 (C)?

python - 二进制数据集的特征选择(分类)

python-3.x - 是否可以保存经过训练的层以在 Keras 上使用层?

machine-learning - 在 Scikit-Learn 中使用近似最近邻进行分类

java - Weka java spreadsubsample 过滤器

java - 如何在 weka 中复制数据集的类值?

machine-learning - 在 Weka 中使用 HMM