machine-learning - 交互式决策树分类器

标签 machine-learning data-mining decision-tree

谁能推荐一个可以增量使用的决策树分类器实现(Python 或 Java 版本)？

我发现的所有实现都要求您立即向分类器提供所有功能才能获得分类。但是，在我的应用程序中，我有数百个功能，其中一些功能可能需要很长时间才能评估。由于并非树的所有分支都可以使用所有特征，因此一次为分类器提供所有特征是没有意义的。我希望分类器询问特征，一次一个，按照需要它们的顺序最大限度地减少熵并提供最终分类。

最佳答案

我相信没有这样的实现，但是决策树实现起来非常简单，您自己编写这样的程序应该不会有任何问题。
另一方面，我不认为动态计算特征的想法可以提高速度，因为即使使用某些特征进行先前的某些分割，仍然必须考虑其余特征，因此对于许多记录来说会被重新计算很多次(不过它可能会节省内存)。这在随机森林的情况下是有意义的，其中每次分割只考虑随机的、有限的特征子集——RF 仍然只能用作分类器，它不会为你构建漂亮的、人类可解释的决策树。

关于machine-learning - 交互式决策树分类器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3237847/

上一篇：artificial-intelligence - 关于聚类方法的问题

下一篇：machine-learning - 为分类问题生成假数据的最佳方法是什么？

相关文章：

python - sklearn 树可视化中的这些列表是什么

machine-learning - 决策树产生不同的输出

python - 使用 nltk 和 scikit-learn 从文本中为标签云挑选最相关的词

hadoop - Mahout聚类与一个昏暗的K均值

apache-spark - 如何在 Apache Spark (PySpark 1.4.1) 中可视化/绘制决策树？

python - 如何在我的决策树中获取所有 Gini 指数？

python - K 表示具有指定簇内距离的簇

r - 为什么在 trainControl 中使用插入符中的 "xgbTree"速度如此之慢？

python - 无法从 LightGBM 重现 L1 分数

machine-learning - 具有高基数属性的决策树