R : replace elements in different columns after multiple comparisons

我有一个原始调查数据 df，其中包含来自 5 个人的 7 项内容。每个人的一项(不是同一项)是比较的对象。向量vec表示该项目的位置。此外，还有两个矩阵 prob1 prob2 用于比较。比较是，如果随机值低于与 prob1 中的项目相同位置的值，则原始调查响应将替换为 9。如果随机值介于 中的值之间>prob1 和 prob2，原始调查响应替换为 99。

在下面的示例中，对于第一个受访者，第 3 项的响应(3)是比较的主题。 prob1 和 prob2 的对应值为 .103 和 .781。由于第一受访者的随机数 .482 介于这两个值之间，因此第一受访者的初始数据需要替换为 99。

我当然可以使用 for 循环来做到这一点，但速度很慢。我尝试使用 sapply 函数，但我确实没有得到正确的解决方案。有什么建议么？谢谢!

set.seed(100)
df<-as.data.frame(matrix(sample(c(1:4),35,replace=T),nrow=5))
vec<-c(3,5,2,3,1)
set.seed(1)
prob1<-round(matrix(runif(35,0,.5), nrow=5),3)
set.seed(2)
prob2<-round(matrix(runif(35,.51,1), nrow=5),3)
ran<-c(.482, .298, .115, .163, .644)

> df
   V1 V2 V3 V4 V5 V6 V7
 1  2  2  3  3  3  1  2
 2  2  4  4  1  3  4  4
 3  3  3  2  2  3  4  2
 4  1  3  3  2  3  3  4
 5  3  1  4  3  2  2  3
> prob1
      [,1]  [,2]  [,3]  [,4]  [,5]  [,6]  [,7]
[1,] 0.133 0.449 0.103 0.249 0.467 0.193 0.241
[2,] 0.186 0.472 0.088 0.359 0.106 0.007 0.300
[3,] 0.286 0.330 0.344 0.496 0.326 0.191 0.247
[4,] 0.454 0.315 0.192 0.190 0.063 0.435 0.093
[5,] 0.101 0.031 0.385 0.389 0.134 0.170 0.414
> prob2
      [,1]  [,2]  [,3]  [,4]  [,5]  [,6]  [,7]
[1,] 0.601 0.972 0.781 0.928 0.834 0.749 0.515
[2,] 0.854 0.573 0.627 0.988 0.700 0.583 0.591
[3,] 0.791 0.918 0.883 0.621 0.920 0.685 0.907
[4,] 0.592 0.739 0.599 0.728 0.584 0.982 0.936
[5,] 0.972 0.779 0.709 0.547 0.680 0.575 0.762

最佳答案

如果我理解正确，您正在尝试访问以下索引

idx <- cbind(seq_along(vec),c(vec))

并且您想要更改 df 其中

ind99 <- ran < prob2[idx] 
ind09 <- ran < prob1[idx]

所以

df[idx[ind99,]] <- 99
df[idx[ind09,]] <-  9

  V1 V2 V3 V4 V5 V6 V7
1  2  2 99  3  3  1  2
2  2  4  4  1 99  4  4
3  3  9  2  2  3  4  2
4  1  3  9  2  3  3  4
5 99  1  4  3  2  2  3

关于R : replace elements in different columns after multiple comparisons，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35350661/

R : replace elements in different columns after multiple comparisons

上一篇：orchardcms - 将 Slack 与 Orchard CMS 集成

下一篇：r - 如何对熔化的数据帧进行零归一化？