r - 如何使用库(插入符号)更改指标?

标签 r r-caret

我想使用以下方法将度量从 RMSE 更改为 RMSLE

 caret library

给定一些样本数据:
  ivar1<-rnorm(500, mean = 3, sd = 1)
  ivar2<-rnorm(500, mean = 4, sd = 1)
  ivar3<-rnorm(500, mean = 5, sd = 1)
  ivar4<-rnorm(500, mean = 4, sd = 1)
  dvar<-rpois(500, exp(3+ 0.1*ivar1 - 0.25*ivar2))

  data<-data.frame(dvar,ivar4,ivar3,ivar2,ivar1)



  ctrl <- rfeControl(functions=rfFuncs,
                  method="cv",
                  repeats = 5,
                  verbose = FALSE,
                  number=5)

model <- rfe(data[,2:4], data[,1], sizes=c(1:4), rfeControl=ctrl)

这里我想改成 RMSLE 并保持图形的想法
plot <-ggplot(model,type=c("g", "o"), metric="RMSE")+ scale_x_continuous(breaks = 2:4, labels = names(data)[2:4])

最佳答案

我不确定如何/是否可以轻松地将 RMSE 转换为 RMSLE,因此您可以尝试更改控制功能。

rfFuncs$summary它调用一个函数 postResample .这是计算 RMSE 的地方 - 查看部分

mse <- mean((pred - obs)^2)
n <- length(obs)
out <- c(sqrt(mse), resamplCor^2)

所以你可以修改这个函数来计算 RMSLE:
msle <- mean((log(pred) - log(obs))^2)
out <- sqrt(msle)
}
names(out) <- "RMSLE"

那么如果这个修改后的函数已经保存在一个名为 mypostResample 的函数中,然后您需要更新 rfFuncs$summary .

总而言之:

首先更新汇总函数 - 这将使用 RMSLE 调用新函数
newSumm <- function (data, lev = NULL, model = NULL) 
          {
          if (is.character(data$obs)) 
          data$obs <- factor(data$obs, levels = lev)
          mypostResample(data[, "pred"], data[, "obs"])
          }

然后定义新函数来计算 RMSLE
mypostResample <- function (pred, obs) 
               {
               isNA <- is.na(pred)
               pred <- pred[!isNA]
               obs <- obs[!isNA]

               msle <- mean((log(pred) - log(obs))^2)
               out <- sqrt(msle)
               names(out) <- "RMSLE"

               if (any(is.nan(out))) 
                  out[is.nan(out)] <- NA
               out
               }

更新 rfFuncs
# keep old settings for future use
oldSumm <- rfFuncs$summary 

# update with new function
rfFuncs$summary <- newSumm

ctrl <- rfeControl(functions=rfFuncs,
                   method="cv",
                   repeats = 5,
                   verbose = FALSE,
                   number=5)
set.seed(1)
model <- rfe(data[,2:4], data[,1], sizes=c(1:4), rfeControl=ctrl, metric="RMSLE")

# plot
ggplot(model,type=c("g", "o"), metric="RMSLE")+ scale_x_continuous(breaks = 2:4, labels = names(data)[2:4])

关于r - 如何使用库(插入符号)更改指标?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28232658/

相关文章:

随机森林 - 插入符号 - 时间序列

r - 使用插入符优化二元分类的偏差

r - 对于 > 2 个类别的结果,插入符训练方法不起作用(所有准确度结果都有问题)

r - 排列 : Speed up, 预测和/或多线程

r - 合并 R 中的相邻区域(聚合空间数据)?

r - R 中的元组遵循 Mathematica 元组[list, n]

r - 为什么递归特征消除程序没有消除无用的预测变量?

R插入符火车glmnet最终模型lambda值不符合指定

r - Pandoc 将 markdown 转换为默认文件名的 Latex

r - ggplot2:添加 geom_smooth() 会破坏点图例