我有一个数据集,其中包含年龄、城市、 child 年龄等信息……以及结果(确认、接受)。
为了帮助“工作流”的建模,我想根据以前的数据集自动创建一个决策树。
我看过http://en.wikipedia.org/wiki/Decision_tree_learning而且我知道问题显然不明显。
我只是想就这个主题的一些算法或一些库提供建议,这些建议可以帮助我构建基于样本的决策树。
最佳答案
你应该看看Weka ,一个免费的基于 Java 的监督学习套件。
将您的数据转换为 Weka 的基于简单文本的数据后 .arff format ,您应该能够使用 GUI 或命令行界面在该数据上训练和测试各种不同的分类器,包括:
- 决策树
- 神经网络
- 基于规则的系统
- 支持 vector 机 (SVM)
- 各种类型的回归
使用此界面进行试验应该可以让您轻松尝试不同的分类器和训练参数,以确定哪些分类器和训练参数对您的数据表现最佳。
您也可以use an API to integrate Weka into your own source code .
关于java - 在 Java 中制作决策树的最佳学习算法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1559851/