tree - WEKA - RandomForest 如何知道树何时太深?

标签 tree machine-learning random-forest

我刚刚开始使用 Weka,当我的决策树太深时我无法理解。 我有一组 423 个特征,据我所知,这些特征是为每个目标随机选择的。因此,这些特征子集生成带有决策叶的分支或流程,这些决策叶似乎不通用,实际上它们太具体了,因为它们仅适用于语料库中所有案例中的一两个案例,例如,否(2/0 ),是(1/0)。 我认为它不能很好地概括,也许这是因为决策树太深了。所以我的问题是,树的 maxDepth 应该是多少?我如何知道树何时太深?我尝试将 maxDepth 更改为 10,但叶子仍然包含基于少数情况的决策。 另外,默认情况下 Weka 生成 10 棵树,我想知道设置更多的树是否会给我带来更好的结果。我读过随机森林适用于 100,300 甚至 500 棵树,但我不知道这是否适用于一组 423 个特征。 最后,我想知道这个决定中的“1”意味着什么:“否(632/1)”。这是否意味着 632 个被正确分类为“否”,但有一个虽然是“否”却被分类为"is"? “1”是误报吗? 感谢您的帮助!

最佳答案

在这种情况下,最好尝试的是对参数进行网格搜索。因此,您可以决定性能指标并找出不同参数的值。这将有利于确定最佳参数设置。还尝试在验证集而不是训练集上计算性能指标。

关于tree - WEKA - RandomForest 如何知道树何时太深?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27429715/

相关文章:

machine-learning - 机器学习中的 OOF 方法是什么?

python - Scikit-learn RandomForestClassifier 错误

python - 随机森林分类器导入

algorithm - 当一个节点消失时如何组织MST?

graph - 给出 n 个顶点的无向连通图中的最小和最大边数?

c - 递归删除树的所有节点

opencv - 给定一张人脸的几帧不一定都是正面的,如何构建人脸识别模型?

java - 按排序顺序获取树的所有叶子

python - 使用 TF-IDF 分数进行文本分类的 KNN

python - 从分类器中检索训练功能名称列表