r - 通过给定变量查找条件的第一个匹配项

标签 r data.table conditional-statements vectorization

我有数据

library(data.table); set.seed(42)
dat <- data.table(id=c(1,1,1,2,2,3,3,3,3,3,4,5,5,5,5), x=rnorm(15))
> dat
#    id           x
# 1:  1  1.37095845
# 2:  1 -0.56469817
# 3:  1  0.36312841
# 4:  2  0.63286260
# 5:  2  0.40426832
# 6:  3 -0.10612452
# 7:  3  1.51152200
# 8:  3 -0.09465904
# 9:  3  2.01842371
#10:  3 -0.06271410
#11:  4  1.30486965
#12:  5  2.28664539
#13:  5 -1.38886070
#14:  5 -0.27878877
#15:  5 -0.13332134

我想为每个 id 获取满足 x 中某些条件的第一个值的索引。例如，对于条件 x>0，这将给出

> res
#[1]  1  4  7 11 12

我希望 data.table 可以使用，因为它的效率一直让我感到惊讶，但其他一些可以快速完成此操作的函数也可以使用。

最佳答案

我们可以在i中指定条件，按'id'分组，用.I获取第一个元素的索引，提取列($ V1)

dat[x >0, .I[1], id]$V1
#[1]  1  4  7 11 12

关于r - 通过给定变量查找条件的第一个匹配项，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48948072/

上一篇：c - 为什么对象 (ELF) 文件中的 .bss 部分没有内容？

下一篇：带有函数案例的联合类型的 F# 相等行为

相关文章：

r - 使用 .SDcols 在 data.table 中的列子集应用函数

C 中的条件结构类型

Java Else If 语句 - 代码不工作？

java - 表达式条件的动态索引，例如 While、If 等

r - 用公式引用 hell

r - dplyr 和 data.table 的不同结果

用 tidyr 分隔时将 NA 替换为零？

r - 查找每个日期的最大速度的有效方法

r - 使用 `by` 过滤 data.table 中的行

r - 提取因子水平的名称