<分区>
我有一个数据集,其中包含每个日期的许多唯一标识符,例如
df <- data.frame(date = as.Date(c("2016-01-01", "2016-01-01", "2016-01-02", "2016-01-02")),
ids = c(3, 4, 1, 3))
然后我想总结这些信息以获得在当前日期出现的新的唯一 ID 的数量。例如,1 月 1 日有两个唯一 ID(3 和 4)。但是在 1 月 2 日,只有一个新的唯一 ID (1)。因此,生成的数据框应如下所示:
date n_new_unique_ids
2016-01-01 2
2016-01-02 1
dplyr
可以吗?我查看了 lag
,但固定的滞后大小在这种情况下没有意义。或者可能使用另一个包?