sklearn 随机森林的文档页面说
The only supported criterion is “mse” for the mean squared error.
我的数据很乱并且有异常值,我觉得 MAE 或一些强大的惩罚函数会表现得更好。
是否有一种方法可以使随机森林回归器适用于其他指标,例如迭代,或者是否有其他 python 开源替代方案,或者我对要求其他指标本身的假设是否错误? Sklearn 在其他领域非常发达,所以我觉得很奇怪,只有 mse 支持随机森林这样重要的方法。
最佳答案
您可以使用 GridSearchCV或 RandomizedSearchCV优化交叉验证循环中的另一个标准。森林本身仍会针对 MSE 进行优化,但 CV 循环会在所选参数设置中找到森林,从而优化您感兴趣的实际标准。(它针对 CV 分数进行优化,而不是训练集分数。)
关于python - 针对其他指标优化 RandomForestRegressor,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24803802/