r - 如何为R中的每个组选择第二行和第三行

标签 r dataframe dplyr

我需要为数据框中的每个组选择第二个和第三个条目。我一直在尝试,但出现错误。

样本数据:

USER.ID   restaurant
3            aaaa
3            ababa
3            asddw
4            bbbb
4            wedwe
2            ewedw
1            qwqw
1            dwqd
1            dqed
1            ewewq

期望的输出:
USER.ID    2nd_restaurant   3rd_restaurant
3            ababa             asddw
3            ababa             asddw
3            ababa             asddw
4            wedwe             NA
4            wedwe             NA
2            NA                NA
1            dwqd              dqed
1            dwqd              dqed
1            dwqd              dqed
1            dwqd              dqed

我尝试使用 dplyr,但我猜由于数据量很大,计算需要很长时间。有没有办法更有效地计算它?

我的代码:
data1 <- data %>%
arrange(USER.ID) %>%
group_by(USER.ID) %>%
mutate(second_restaurant = data[2,11]) %>%
mutate(third_restaurant = data[3,11])

11为原始数据集中餐厅的列号。

最佳答案

先复制餐厅列,然后使用mutate提取相关值:

mydf %>%
  mutate(restaurant2 = restaurant) %>%
  group_by(USER.ID) %>%
  mutate(restaurant = restaurant[2], restaurant2 = restaurant2[3])
# Source: local data frame [10 x 3]
# Groups: USER.ID
# 
#    USER.ID restaurant restaurant2
# 1        3      ababa       asddw
# 2        3      ababa       asddw
# 3        3      ababa       asddw
# 4        4      wedwe          NA
# 5        4      wedwe          NA
# 6        2         NA          NA
# 7        1       dwqd        dqed
# 8        1       dwqd        dqed
# 9        1       dwqd        dqed
# 10       1       dwqd        dqed

或者,更好(由@StevenBeaupré 提供):
mydf %>% 
  group_by(USER.ID) %>% 
  transmute(restaurant2 = nth(restaurant, 2), 
            restaurant3 = nth(restaurant, 3))

或者,如果您更喜欢“data.table”,来解释@DavidArenburg,您可以尝试:
library(data.table)
as.data.table(mydf)[, `:=`(restaurant_2 = restaurant[2L], 
                           restaurant_3 = restaurant[3L]), by = USER.ID][]

或者,您甚至可以使用基础 R:
mydf[c("restaurant_2", "restaurant_3")] <- with(mydf, lapply(c(2, 3), function(x) {
  ave(restaurant, USER.ID, FUN = function(y) y[x])
}))

关于r - 如何为R中的每个组选择第二行和第三行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31158895/

相关文章:

python - 将 R 升级到 3.0.1 后 rpy2 不工作

python - 使用 R 抓取 PDF

r - 如何有效地可视化递归函数?

python - 如何从nd数组python中删除空格

r - 如何在 r 中包含分段 geom_smooth 的标签?

r - 在 Base R 或 dplyr : How to keep the row with value == "HIT" and the 4 rows preceeding it

r - tryCatch() 显然忽略了警告

python - 将 Excel 导入 Panda Dataframe

python - Pandas 将基于日期时间类型的数据框分组到忽略日期部分的不同时期

r - 汇总数据框以沿子集返回非 NA 值