r - 加速 R 中 sapply 调用中使用的函数

标签 r sapply

我有两个向量eg。我想知道 e 中的每个元素在 g 中较小元素的百分比。在 R 中实现这一点的一种方法是:

set.seed(21)
e <- rnorm(1e4)
g <- rnorm(1e4)
mf <- function(p,v) {100*length(which(v<=p))/length(v)}
mf.out <- sapply(X=e, FUN=mf, v=g)

对于较大的 eg,这需要花费大量时间来运行。我如何更改或调整此代码以使其运行得更快?

注意:上面的 mf 函数基于 dismo 包中的 mess 函数的代码。

最佳答案

之所以这么慢,是因为您调用了函数 length(e) 次。对于小向量来说,这并没有太大的区别,但 R 函数调用的开销确实开始随着较大的向量而增加。

通常,您需要将其移至已编译的代码中,但幸运的是您可以使用 findInterval:

set.seed(21)
e <- rnorm(1e4)
g <- rnorm(1e4)
O <- findInterval(e,sort(g))/length(g)

# Now for some timings:
f <- function(p,v) mean(v<=p)
system.time(o <- sapply(e, f, g))
#   user  system elapsed 
#   0.95    0.03    0.98
system.time(O <- findInterval(e,sort(g))/length(g))
#   user  system elapsed 
#      0       0       0 
identical(o,O)  # may be FALSE
all.equal(o,O)  # should be TRUE

# How fast is this on large vectors?
set.seed(21)
e <- rnorm(1e7)
g <- rnorm(1e7)
system.time(O <- findInterval(e,sort(g))/length(g))
#   user  system elapsed 
#  22.08    0.08   22.31

关于r - 加速 R 中 sapply 调用中使用的函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12982152/

相关文章:

r - R 中 data.frames 与 sapply 之间的高效坐标匹配

r - 如何将列中的所有 NA 换成中位数?

r - 比较 R 中各种数据框的列名

r - 在 R 中使用 sapply 绘制并排图

c - 将 SEXP 结构转储到控制台

r - p.adjust 尊重整个数据框

r - 如何使用多列中的响应来创建新列?

r - 使用 for 循环创建互差矩阵

r - 如何四舍五入矩阵中的所有值?

r - 字符向量上的 "subscript out of bounds"