machine-learning - scikit-learn 的决策树实现中如何保证 min_samples_leaf ？

决策树的实现checks that there are more than 2 * min_samples_leaf nodes在调用分离器之前，这一切都很好。

然后，在分割器的实现中，按所选功能排序后，我们有一个 while 循环，它运行所有可能的分割，并根据杂质选择最好的分割:

在我看来，这是完全有可能的——due to this while loop ——我们没有找到任何合适的分割。一个例子是:

Xf = [0,0,0,1]
min_samples_leaf = 2

在这种情况下，我们找不到任何合适的分割，“最佳位置”默认为“结束位置”。我在这里遗漏了什么吗？

最佳答案

找到了我自己的答案哈-

如果我们找不到任何合适的分割，“最佳位置”默认为“结束位置”，但“结束位置”不是有效位置，分割器的调用者将检查这一点并将其自身标记为叶子如果发生这种情况。

关于machine-learning - scikit-learn 的决策树实现中如何保证 min_samples_leaf ？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59783957/