任何人都可以帮助我使用 Java 中的 Weka API 在 J48 算法中实现替代的缺失值处理吗?
我确信在训练 J48 之前使用预插补方法很容易。
但是,在对训练日期进行分区时使用代理分割属性(就像 Breiman 在 CART 中所做的那样)而不是 J48 标准方法(C4.5 中的 Quinlan)将案例从观察到的案例中按照概率分布进行拆分,有什么意义呢?已知值。
任何人都可以给我一些信息、提示、帮助吗?Weka API 和源代码中的哪些位置必须修改才能用代理分割替换标准?
最佳答案
看weka源码weka.classifiers.trees.j48.C45ModelSelection来自第 152 行(查找要分割的“最佳”属性)。它使用信息增益比作为 split 标准。
关于java - Weka:如何在 J48 决策树中实现代理分割?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24629999/