我想使用随机森林进行属性缩减。我的数据中存在的一个问题是我没有离散类 - 只有连续类,这表明示例与“正常”有何不同。此类属性是一种从零到无穷大的距离。 有没有办法对此类数据使用随机森林?
最佳答案
这应该没问题——RF 将切换到回归模式。使用 randomForest
包中的 randomForest
函数。
要使用 proximity=TRUE
参数获取对象相似度,例如:
randomForest(Sepal.Length~.,data=iris,proximity=TRUE)$proximity
要获取节点纯度(类似基尼指数)属性重要性:
randomForest(Sepal.Length~.,data=iris)$importance[,"IncNodePurity"]
要获得平均 MSE 增加(类似精度降低)属性重要性:
randomForest(Sepal.Length~.,data=iris,importance=TRUE)$importance[,"%IncMSE"]
关于r - 如何使用R随机森林来减少没有离散类的属性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3198111/