python - 针对其他指标优化 RandomForestRegressor

标签 python scikit-learn

sklearn 随机森林的文档页面说

The only supported criterion is “mse” for the mean squared error.

我的数据很乱并且有异常值,我觉得 MAE 或一些强大的惩罚函数会表现得更好。

是否有一种方法可以使随机森林回归器适用于其他指标,例如迭代,或者是否有其他 python 开源替代方案,或者我对要求其他指标本身的假设是否错误? Sklearn 在其他领域非常发达,所以我觉得很奇怪,只有 mse 支持随机森林这样重要的方法。

最佳答案

您可以使用 GridSearchCVRandomizedSearchCV优化交叉验证循环中的另一个标准。森林本身仍会针对 MSE 进行优化,但 CV 循环会在所选参数设置中找到森林,从而优化您感兴趣的实际标准。(它针对 CV 分数进行优化,而不是训练集分数。)

关于python - 针对其他指标优化 RandomForestRegressor,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24803802/

相关文章:

python - 通过线程下载安全中断程序

python - 对嵌套文件夹结构机器人框架中的多个测试套件使用通用套件设置和套件拆解

python - TF-IDF + 多元回归预测问题

python - 如何在所有列上使用 RobustScaler?

python - 如何在 Pandas 中加载这种数据

python - 在 Python 中使用多个定时器是否危险?

Python __str__ 与 __unicode__

python - python3-mock 和 unittest.mock 有什么区别?

python - 如何使用 scikit 学习具有新值的 inverse_transform

python - 有任何信息理论可以帮助我在无需目视检查的情况下对数据集进行聚类吗?