java - Weka:如何在 J48 决策树中实现代理分割?

标签 java weka decision-tree missing-data surrogate-pairs

任何人都可以帮助我使用 Java 中的 Weka API 在 J48 算法中实现替代的缺失值处理吗?

我确信在训练 J48 之前使用预插补方法很容易。

但是,在对训练日期进行分区时使用代理分割属性(就像 Breiman 在 CART 中所做的那样)而不是 J48 标准方法(C4.5 中的 Quinlan)将案例从观察到的案例中按照概率分布进行拆分,有什么意义呢?已知值。

任何人都可以给我一些信息、提示、帮助吗?Weka API 和源代码中的哪些位置必须修改才能用代理分割替换标准?

最佳答案

看weka源码weka.classifiers.trees.j48.C45ModelSelection来自第 152 行(查找要分割的“最佳”属性)。它使用信息增益比作为 split 标准。

关于java - Weka:如何在 J48 决策树中实现代理分割?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24629999/

相关文章:

machine-learning - Weka,无法让最近的邻居使用当前的测试和训练集

java - 在weka java中找不到makeCopy方法的符号

cuda - CUDA内核中的数据结构

Java - 如何知道哪个 Java 版本可以在不更改代码的情况下使用我的代码

java - 带有变量的 Servlet 映射(Tomcat 7.0)

java - 22/10/18 的日期模式 - 3 :05pm - java. time.format.DateTimeParseException:需要帮助识别正确的日期模式

matlab - 来自 Matlab 的 Weka : Attribute Selection

c# - 生成决策树的库

python-3.x - 如何改进决策树回归器中的负 R 平方

java - 如何在 select Struts2 中选择一个 HashMap 的值?