r - 生成一个循环来匹配 ID

我有两个数据框，每个数据框都包含标识符。

df1 <- data.frame(ID = c(20001, 20001, 20003, 20003, 20003, 20003))
df2 <- data.frame(ID = c(20001, 20001, 20003, 20003, 20003, 20005),
                  Type = c('N1', 'N2', 'N3', 'N4', 'N5', 'N6'))

我想通过匹配 ID 在 df1 中使用 df2$Type 的值创建第二列。这是我常用的查找值的方法

df1$Add <- df2$Type[match(df1$ID, df2$ID)]

但是，使用这种匹配方法将获得第一个 ID 匹配并带来相应的值，给我这样的结果

相反，我想为每个重复的 ID 引入“下一个”类型值，本质上是在循环中。理想情况下，我想跟踪输出。

我认为它需要使用 lapply 以及可能的用户定义函数。

最佳答案

这是您要找的吗？

library(dplyr)
df1 %>% group_by(ID) %>% 
        mutate(c = rep(df2$Type[df2$ID == unique(ID)], length.out = n()))

#     ID      c
#1 20001     N1
#2 20001     N2
#3 20003     N3
#4 20003     N4
#5 20003     N5
#6 20003     N3

# incase of efficiency, 

library(data.table)
setDT(df2)
setDT(df1)[,  x := rep(df2$Type[df2$ID == ID], length.out = .N),by = .(ID)]

# i'm looking for a base R solution without involving merge
# as of now my bet is on sapply() - but not utilised efficiently

unlist(sapply(unique(df1$ID), function(x) rep(df2$Type[df2$ID == x],
                                              length.out = sum(x==df1$ID))))
# [1] N1 N2 N3 N4 N5 N3

关于r - 生成一个循环来匹配 ID，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41810105/

r - 生成一个循环来匹配 ID

上一篇：angular - woff2、woff 和 ttf 文件未加载并给出 400 错误

下一篇：asp.net - 将调试器附加到手动启动的 IISExpress 实例时没有符号