我有两个数据框(实际上是 data.tables)。
set.seed(123)
dt1 <- data.table(P=rep(letters[1:3],c(4,2,3)),X=sample(9))
dt1
P X
1: a 3
2: a 7
3: a 9
4: a 6
5: b 5
6: b 1
7: c 2
8: c 8
9: c 4
和:
dt2 <- data.table(P=rep(letters[1:5],length=10),D=c("X","Y","Z","G","F"))
dt2
P D
1: a X
2: b Y
3: c Z
4: d G
5: e F
6: a X
7: b Y
8: c Z
9: d G
10: e F
现在我想向 dt1 添加一个新列,dt2 的列“D”,其中 P 在 dt1 和 dt2 中具有相同的值。它应该是这样的:
dt_new
P X D
1: a 3 X
2: a 7 X
3: a 9 X
4: a 6 X
5: b 5 Y
6: b 1 Y
7: c 2 Z
8: c 8 Z
9: c 4 Z
最佳答案
我会做一个 data.table join
以这种方式:
setkey(dt1, P)
dt1[unique(dt2),nomatch=0]
P X D
1: a 3 X
2: a 7 X
3: a 9 X
4: a 6 X
5: b 5 Y
6: b 1 Y
7: c 2 Z
8: c 8 Z
9: c 4 Z
关于r - 带有两个 data.tables 的类似合并的场景,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18345905/