randomForestSRC 预测值

标签 r

我一直在尝试使用 R 包“randomForestSRC”来预测一些东西,但是在运行“rfsrc”和“predict.rfsrc”之后。两者都有一个称为预测的返回,但预测值似乎与我的任何值都不相关。有谁知道这些预测值是多少?

我运行的命令:(这是来自他们在文档中的示例)

data(veteran, package = "randomForestSRC")
train <- sample(1:nrow(veteran), round(nrow(veteran) * 0.80))
veteran.grow <- rfsrc(Surv(time, status) ~ ., veteran[train, ], ntree = 100)
veteran.pred <- predict(veteran.grow, veteran[-train , ])

预测值:
veteran.pred$predicted
[1] 49.96350 58.45100 38.28317 63.17000 67.56917 57.45633 66.23733 54.81967 72.60817 47.71083 43.94983 37.85000
[13] 41.80333 47.84233 85.81488 70.49050 92.45600 70.95321 85.63933 45.38833 66.74655 76.46067 52.68717 68.90750
[25] 85.17983 43.31617 48.80267

最佳答案

来自 rfsrc 的预测值和 predict.rfsrc是基于所有构建的树的预测,分别使用训练数据和测试数据。

#In-bag predicted value for the first case in training data
veteran.grow$predicted[1]
> 80.56843

#Prediction based on all trees for the same case
predict(veteran.grow, 
        newdata=veteran[train[1],])$predicted
> 80.56843

rfsrc也返回 out-of-bag predictionpredicted.oob .这是基于在建筑过程中没有使用案例的树木。例如,如果案例 1 用于树 1 到 30,则案例 1 的 OOB 预测将基于树 31 到 100,而不是所有树。
#Keeping the info about nodes of each tree
veteran.grow <- rfsrc(Surv(time, status) ~ ., veteran[train, ], ntree = 100, 
  membership=T)

#Out-of-bag predicted value for the first case
veteran.grow$predicted.oob[1]
> 72.88305

#Prediction based on the trees that case 1 was not included in
ind = which(veteran.grow$inbag[1,]==0)
predict(veteran.grow, 
        newdata=veteran[train[1],], 
        get.tree=ind)$predicted
> 72.88305

关于randomForestSRC 预测值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37974572/

相关文章:

r - 分配 S3 子集运算符

c - R的C接口(interface)中NewEnvironment和R_NewHashedEnvironment的区别

r - 使用 GGPLOT 创建 ROC 曲线

css - 没有填充的 R Shiny 表输出

r - 如何使用来自不同数据集的变量制作带状图?

r - 更改 alpha 不会影响 ggplot2 中的任何内容

r - 在 sqldf 中将引用声明为 "quote"

r - 如何在不构建或安装包的情况下运行 R 包测试?

R函数solve.QP错误 "constraints are inconsistent, no solution!"

r - 如何根据R中的周数计算日期