r - 如何使用R随机森林来减少没有离散类的属性?

标签 r statistics machine-learning feature-selection random-forest

我想使用随机森林进行属性缩减。我的数据中存在的一个问题是我没有离散类 - 只有连续类,这表明示例与“正常”有何不同。此类属性是一种从零到无穷大的距离。 有没有办法对此类数据使用随机森林?

最佳答案

这应该没问题——RF 将切换到回归模式。使用 randomForest 包中的 randomForest 函数。
要使用 proximity=TRUE 参数获取对象相似度,例如:

randomForest(Sepal.Length~.,data=iris,proximity=TRUE)$proximity

要获取节点纯度(类似基尼指数)属性重要性:

randomForest(Sepal.Length~.,data=iris)$importance[,"IncNodePurity"]

要获得平均 MSE 增加(类似精度降低)属性重要性:

randomForest(Sepal.Length~.,data=iris,importance=TRUE)$importance[,"%IncMSE"]

关于r - 如何使用R随机森林来减少没有离散类的属性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3198111/

相关文章:

c++ - 在统计学家类中实现乘数

python - scipy,对数正态分布 - 参数

matlab - 无需工具箱即可在 MATLAB 中实现遗传算法

c# - Numl.net 中训练数据的后备存储并添加到其中以提高准确性

r - 找不到 geom_rect() 主变量

r - 如何在ggplot条形图中对子组进行排序?

R Shiny : Using a Vector for Display and another Vector for Value in Choice List

algorithm - 根据正常运行时间/重启创建计算设备 "health"的公式

machine-learning - 始终保持高精度的 SVM 分类

r - 当我在 RStudio 中创建文档 Rmarkdown-slidify-deck.js 时,如何包含扩展 dial.automation.js 的使用?