换句话说,我试图滞后一个看起来像这样的 data.frame:
V1 V2 V3 V4 V5 V6
1 1 1 1 1 1
2 2 2 2 2 NA
3 3 3 3 NA NA
4 4 4 NA NA NA
5 5 NA NA NA NA
6 NA NA NA NA NA
看起来像这样的东西:
V1 V2 V3 V4 V5 V6
1 NA NA NA NA NA
2 1 NA NA NA NA
3 2 1 NA NA NA
4 3 2 1 NA NA
5 4 3 2 1 NA
6 5 4 3 2 1
到目前为止,我已经使用了一个计算 NA 数量的函数,并尝试将我的 data.frame 中的每一列滞后于该列中相应的 NA 数量。
V1 <- c(1,2,3,4,5,6)
V2 <- c(1,2,3,4,5,NA)
V3 <- c(1,2,3,4,NA,NA)
V4 <- c(1,2,3,NA,NA,NA)
V5 <- c(1,2,NA,NA,NA,NA)
V6 <- c(1,NA,NA,NA,NA,NA)
mydata <- cbind(V1,V2,V3,V4,V5,V6)
na.count <- colSums(is.na(mydata))
lag.by <- function(mydata, na.count){lag(mydata, k = na.count)}
lagged.df <- apply(mydata, 2, lag.by)
但是这段代码只是落后于整个 data.frame 一个......
最佳答案
一个选项是使用 apply
遍历列并首先通过使用 is.na
对 NA 元素进行子集化来附加 NA 元素,然后是非 NA 元素通过否定逻辑向量 (is.na
)
apply(mydata, 2, function(x) c(x[is.na(x)], x[!is.na(x)]))
# V1 V2 V3 V4 V5 V6
#[1,] 1 NA NA NA NA NA
#[2,] 2 1 NA NA NA NA
#[3,] 3 2 1 NA NA NA
#[4,] 4 3 2 1 NA NA
#[5,] 5 4 3 2 1 NA
#[6,] 6 5 4 3 2 1
关于r - 将 data.frame 滞后 NA 的数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51823074/