我突然想到,例如,假设我们有二维 N
点的训练数据。我们知道我们总是可以天真地构建一个决策树,以便我们可以对每个数据点进行分类。 (可能我们过拟合了,深度可以到2N)
但是,我们知道如果数据集是线性可分的,那么决策树可能会占据优势。以上面的数据集为例,我们可以确定线性和非线性数据集的深度上限吗?是否保证线性情况的深度上限小于非线性情况?
最佳答案
关于algorithm - C4.5 决策树 : can deeps be higher in linear separable data then non-linear separable?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32891497/