R data.table 查找当前行与上一行之间的滞后

标签 r data.table row lag shift

> tempDT <- data.table(colA = c("E","E","A","A","E","A","E")
+                      , lags = c(NA,1,1,2,3,1,2))
> tempDT
   colA lags
1:    E   NA
2:    E    1
3:    A    1
4:    A    2
5:    E    3
6:    A    1
7:    E    2

我有列 colA,需要查找当前行与 colA == "E" 的上一行之间的滞后。

注意:如果我们可以找到上一行的 colA == "E" 的行引用,那么我们就可以计算滞后。但是,我不知道如何实现它。

最佳答案

1) 定义 lastEpos其中给出 i返回最后一个 E 的位置其中第一名 i行并将其应用于每个行号:

lastEpos <- function(i) tail(which(tempDT$colA[1:i] == "E"), 1)
tempDT[, lags := .I - shift(sapply(.I, lastEpos))]

以下是一些变化:

2) i-1 在此变体中 lastEpos返回最后一个 E 的位置其中第一名 i-1行而不是 i :

lastEpos <- function(i) tail(c(NA, which(tempDT$colA[seq_len(i-1)] == "E")), 1)
tempDT[, lags := .I - sapply(.I, lastEpos)]

3) 位置 与 (2) 类似,但使用 Position :

lastEpos <- function(i) Position(c, tempDT$colA[seq_len(i-1)] == "E", right = TRUE)
tempDT[, lags := .I - sapply(.I, lastEpos)]

4)rollapply

library(zoo)
w <- lapply(1:nrow(tempDT), function(i) -rev(seq_len(i-1)))
tempDT[, lags := .I - rollapply(colA == "E", w, Position, f = c, right = TRUE)]

5) sqldf

library(sqldf)

sqldf("select a.colA, a.rowid - b.rowid lags
       from tempDT a left join tempDT b
       on b.rowid < a.rowid and b.colA = 'E'
       group by a.rowid")

关于R data.table 查找当前行与上一行之间的滞后,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49142288/

相关文章:

r - 规范范围为0和1的矩阵行

php - 如何从DataTables行中获取值?

r - 返回单个条形的堆积条形图

r - 如何将R中的向量组合成数据帧?

r - 使用VBA在excel中融化/ reshape ?

r - 在R中为data.table按组查找最大值的索引

r - 使用 `by` 子句时在 data.table 中调度 S3 方法

r - 如何更快地计算排列 "cross join"?

ios - 当我在 UITableview 上滚动时,多个选定行的复选标记消失了。如何解决这个问题?

r - 如何仅获取 lm 对象上的特定摘要行