谁能推荐一个可以增量使用的决策树分类器实现(Python 或 Java 版本)?
我发现的所有实现都要求您立即向分类器提供所有功能才能获得分类。但是,在我的应用程序中,我有数百个功能,其中一些功能可能需要很长时间才能评估。由于并非树的所有分支都可以使用所有特征,因此一次为分类器提供所有特征是没有意义的。我希望分类器询问特征,一次一个,按照需要它们的顺序最大限度地减少熵并提供最终分类。
最佳答案
我相信没有这样的实现,但是决策树实现起来非常简单,您自己编写这样的程序应该不会有任何问题。
另一方面,我不认为动态计算特征的想法可以提高速度,因为即使使用某些特征进行先前的某些分割,仍然必须考虑其余特征,因此对于许多记录来说会被重新计算很多次(不过它可能会节省内存)。
这在随机森林的情况下是有意义的,其中每次分割只考虑随机的、有限的特征子集——RF 仍然只能用作分类器,它不会为你构建漂亮的、人类可解释的决策树。
关于machine-learning - 交互式决策树分类器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3237847/