tree - WEKA - RandomForest 如何知道树何时太深？

标签 tree machine-learning random-forest

我刚刚开始使用 Weka，当我的决策树太深时我无法理解。我有一组 423 个特征，据我所知，这些特征是为每个目标随机选择的。因此，这些特征子集生成带有决策叶的分支或流程，这些决策叶似乎不通用，实际上它们太具体了，因为它们仅适用于语料库中所有案例中的一两个案例，例如，否(2/0 )，是(1/0)。我认为它不能很好地概括，也许这是因为决策树太深了。所以我的问题是，树的 maxDepth 应该是多少？我如何知道树何时太深？我尝试将 maxDepth 更改为 10，但叶子仍然包含基于少数情况的决策。另外，默认情况下 Weka 生成 10 棵树，我想知道设置更多的树是否会给我带来更好的结果。我读过随机森林适用于 100,300 甚至 500 棵树，但我不知道这是否适用于一组 423 个特征。最后，我想知道这个决定中的“1”意味着什么:“否(632/1)”。这是否意味着 632 个被正确分类为“否”，但有一个虽然是“否”却被分类为"is"？ “1”是误报吗？感谢您的帮助!

最佳答案

在这种情况下，最好尝试的是对参数进行网格搜索。因此，您可以决定性能指标并找出不同参数的值。这将有利于确定最佳参数设置。还尝试在验证集而不是训练集上计算性能指标。

关于tree - WEKA - RandomForest 如何知道树何时太深？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/27429715/

上一篇：python - 如何使用 scikit-learn 加载文件并处理 .txt 文件？

下一篇：python - LinearSVC 无法使用均值差进行分类

相关文章：

machine-learning - 机器学习中的 OOF 方法是什么？

python - Scikit-learn RandomForestClassifier 错误

python - 随机森林分类器导入

algorithm - 当一个节点消失时如何组织MST？

graph - 给出 n 个顶点的无向连通图中的最小和最大边数？

c - 递归删除树的所有节点

opencv - 给定一张人脸的几帧不一定都是正面的，如何构建人脸识别模型？

java - 按排序顺序获取树的所有叶子

python - 使用 TF-IDF 分数进行文本分类的 KNN

python - 从分类器中检索训练功能名称列表