machine-learning - Weka 中的标准化+每折叠特征选择

标签 machine-learning classification weka

我想对数据集进行标准化和执行输入选择,但要分别训练和测试集(也在 10 倍分类的情况下)。

我已经发现,如果我使用实验器,我可以添加如下功能选择: -> 简单 -> 算法 -> 添加新的 -> 元 -> AttributeSelectodClassifier。

如果 Weka 的专家能够确认上述方法是否在训练集(而不是完整的训练+测试集)上执行属性选择,那就太好了。

对于我问题的第二部分。我还没有找到如何实现标准化。我知道某些分类器包含标准化,但我使用多个分类器,但并非所有分类器都具有标准化。我可以在某处放置归一化过滤器吗?我的审稿人问这个问题,我不想手动折叠 10 次。

最佳答案

根据我在weka论坛上提出的问题: 我执行 Meta-> FilteredClassifier,然后作为分类器,我选择 Meta-> AttributeSelectedClassifier,然后它应该只规范化/特征选择训练集。 See reference.

关于machine-learning - Weka 中的标准化+每折叠特征选择,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20048670/

相关文章:

python - scikit拟合数据错误

python - 网格搜索和计算机处于 sleep 模式

python - scikit 学习中的样本权重和类权重选项有什么区别?

machine-learning - 如何计算二分类的基尼指数?

python - 在 Mac OS X 上使用 NLTK 在 Celery 线程中使用 python-javabridge JVM 时出现 fatal error

machine-learning - 多维异构空间上的K-Means聚类

machine-learning - ROC曲线和精确召回曲线

math - 模型的预测概率与置信水平相同吗?

machine-learning - 训练和测试集在构建决策树并使用它进行分类中的作用

java - 在 Java 中使用朴素贝叶斯 (weka) 进行简单文本分类