python - 如何提高随机森林多类分类模型的准确率？

我正在研究多类别分类，根据客户的购买行为和人口统计数据将客户分为 3 个不同的类别。我无法完全透露该数据集，但总的来说它包含大约 300 个特征和 50000 行。我尝试过以下方法，但无法达到 50% 以上的准确率:

我还可以尝试其他方法来提高准确性(我所说的准确性是指 f 分数、精确度和召回率)。

任何帮助将不胜感激。

最佳答案

尝试调整以下参数

n_估计器

这是在进行最大投票或预测平均值之前要构建的树数。树的数量越多，性能越好，但代码也会变慢。您应该选择处理器可以处理的尽可能高的值，因为这会使您的预测更强大、更稳定。由于您的数据量较大，因此每次迭代将花费更多时间，但请尝试此操作。

这些是随机森林允许在单个树中尝试的最大特征数。 Python 中有多个选项可用于分配最大特征。其中很少有:

叶子是决策树的末端节点。较小的叶子使模型更容易捕获训练数据中的噪声。您可以从一些最小值(例如 75)开始，然后逐渐增加它。查看哪个值您的准确性较高。

关于python - 如何提高随机森林多类分类模型的准确率？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53634808/