我想对数据集进行标准化和执行输入选择,但要分别训练和测试集(也在 10 倍分类的情况下)。
我已经发现,如果我使用实验器,我可以添加如下功能选择: -> 简单 -> 算法 -> 添加新的 -> 元 -> AttributeSelectodClassifier。
如果 Weka 的专家能够确认上述方法是否在训练集(而不是完整的训练+测试集)上执行属性选择,那就太好了。
对于我问题的第二部分。我还没有找到如何实现标准化。我知道某些分类器包含标准化,但我使用多个分类器,但并非所有分类器都具有标准化。我可以在某处放置归一化过滤器吗?我的审稿人问这个问题,我不想手动折叠 10 次。
最佳答案
根据我在weka论坛上提出的问题: 我执行 Meta-> FilteredClassifier,然后作为分类器,我选择 Meta-> AttributeSelectedClassifier,然后它应该只规范化/特征选择训练集。 See reference.
关于machine-learning - Weka 中的标准化+每折叠特征选择,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20048670/