我有一个数据集,其中包含时间 t1 和 t2 的树木测量值。这些树木按州、县、地 block 和树木编号进行标识。在 t1 和 t2 之间的时间间隔内,有一些树已经死亡。
State County Plot Tree Meas_yr
1 9 1 1 t1
1 9 1 2 t1
1 9 1 3 t1
1 9 1 1 t2
1 9 1 2 t2
我正在尝试创建一个二进制标签,如果树同时存在于 t1 和 t2 中,则为 1;如果树存在于 t1 中但不存在于 t2 中,则为 0 。我希望能创造出这样的东西。
State County Plot Tree Meas_yr tree_survival
1 9 1 1 t1 1
1 9 1 2 t1 1
1 9 1 3 t1 0
1 9 1 1 t2 1
1 9 1 2 t2 1
我非常感谢您的帮助。 提前致谢。
编辑:我有一个后续问题。与上面的数据集类似,有一些新树在时间 t2 中生长,但在时间 t1 中不存在。如何创建另一个标签,其中仅存在于 t2 中的树为 1,其他树为 0。
最佳答案
我们可以使用
library(dplyr)
df1 %>%
group_by(State, County, Plot, Tree) %>%
mutate(available = +('t2' %in% Meas_yr))
关于r - 添加一列以指示某个项目在不同时间戳中的存在,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73737118/