java - Weka:如何在 J48 决策树中实现代理分割？

任何人都可以帮助我使用 Java 中的 Weka API 在 J48 算法中实现替代的缺失值处理吗？

我确信在训练 J48 之前使用预插补方法很容易。

但是，在对训练日期进行分区时使用代理分割属性(就像 Breiman 在 CART 中所做的那样)而不是 J48 标准方法(C4.5 中的 Quinlan)将案例从观察到的案例中按照概率分布进行拆分，有什么意义呢？已知值。

任何人都可以给我一些信息、提示、帮助吗？Weka API 和源代码中的哪些位置必须修改才能用代理分割替换标准？

最佳答案

看weka源码weka.classifiers.trees.j48.C45ModelSelection来自第 152 行(查找要分割的“最佳”属性)。它使用信息增益比作为 split 标准。

关于java - Weka:如何在 J48 决策树中实现代理分割？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24629999/