我对使用逻辑向量的向量化运算有疑问。在我的问题中,有两个向量:主要向量和次要向量。它们的长度相同。根据我从 secondary 向量中收集到的见解,我想将 main 向量中的一些元素替换为 NA
。
- 主向量由
TRUE
和FALSE
组成,可以以任何随机顺序出现。 - 辅助向量是:
- 一个
TRUE
序列,然后是一个FALSE
序列,有/没有NA
作为最后一个元素; 或 - 所有
TRUE
; 或 - 所有
FALSE
; 或 - 所有
FALSE
,最后一个元素为NA
; 或 - 所有
TRUE
,最后一个元素为NA
- 一个
我将在下面提供几个示例并解释所需的算法。
A - 最常见的情况
对于 y
FALSE
的位置,将 x
值替换为 NA
# here, `x` is the main vector
x <- c(FALSE, FALSE, TRUE, FALSE, FALSE, FALSE, NA)
# `y` is the secondary vector
y <- c(TRUE, TRUE, TRUE, TRUE, TRUE, FALSE, FALSE)
# `z` is the desired output
z <- c(FALSE, FALSE, TRUE, FALSE, FALSE, NA, NA) # in this case only index 7 in `x` actually changed
B - 辅助向量全部为 FALSE
x2 <- c(FALSE, NA)
y2 <- c(FALSE, FALSE)
# desired output
z2 <- c(NA, NA)
C - 辅助向量全部为 TRUE
x3 <- rep(FALSE, 4)
y3 <- rep(TRUE, 4)
# desired output
z3 <- rep(FALSE, 4)
我的尝试
我几乎已经想通了,但不幸的是,它在场景 B 中失败了。
my_func <- function(main, secondary) {
idx_last_true_in_secondary <- max(which(secondary))
if(idx_last_true_in_secondary == length(secondary)) {
return(main)
}
main[(idx_last_true_in_secondary + 1): length(main)] <- NA
main
}
# case A
my_func(x, y)
#> [1] FALSE FALSE TRUE FALSE FALSE NA NA
# case B
my_func(x2, y2)
#> Warning in max(which(secondary)): no non-missing arguments to max; returning
#> -Inf
#> Error in (idx_last_true_in_secondary + 1):length(main): result would be too long a vector
# case C
my_func(x3, y3)
#> [1] FALSE FALSE FALSE FALSE
我的问题是是否有人看到了解决问题的更好方法?
最佳答案
这似乎按预期工作:
my_func <- function(main,secondary ) {
main[!secondary] <- NA
return(main)
}
my_func(x,y)
[1] FALSE FALSE TRUE FALSE FALSE NA NA
my_func(x2,y2)
[1] NA NA
my_func(x3,y3)
[1] FALSE FALSE FALSE FALSE
关于r - 使用 2 个逻辑向量 : replace values in first vector to NA according to FALSE values in the other vector 进行向量化操作的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70494080/