r - 标记基于参数的记录第一次出现在 r 数据框中

标签 r sorting head

我有一个包含多个列的数据框df

数据框已按联系人 ID C_ID 排序。 C_ID 可以在数据框中出现多次。我想在 C_ID 第一次出现时在 MainRecord 列中放置一个“X”,以便结果如下:

C_ID  Name  MainRecord
1     JM    X
1     JM  
1     JM  
2     DM    X
3     TY    X
3     TY

我认为我的解决方案需要引用 head 函数:df[,head(1)]

最佳答案

我们可以按“C_ID”、“Name”进行分组,并使用 case_when 创建“MainRecord”

library(dplyr)
df1 %>%
  group_by(C_ID, Name) %>%
  mutate(MainRecord = case_when(row_number()==1 ~ "X", TRUE ~ ""))
# A tibble: 6 x 3
# Groups:   C_ID, Name [3]
#   C_ID Name  MainRecord
#  <int> <chr> <chr>     
#1     1 JM    X         
#2     1 JM    ""        
#3     1 JM    ""        
#4     2 DM    X         
#5     3 TY    X         
#6     3 TY    ""        
<小时/>

或者另一个选项是ifelse

df1 %>%
   group_by(C_ID, Name) %>% 
   mutate(MainRecord = ifelse(row_number()==1, "X", ""))
<小时/>

或者使用索引

df1 %>% 
   group_by(C_ID, Name) %>% 
   mutate(MainRecord = c("", "X")[(row_number()==1) + 1])
<小时/>

或者使用 data.table,使用 .I 获取行索引并分配 (:=) 对应的“X”值到行

library(data.table)
i1 <- setDT(df1)[, .I[seq_len(.N) == 1], .(C_ID, Name)]$V1
df1[i1, MainRecord := "X"]
<小时/>

或者使用基础R

i1 <- with(df1, ave(seq_along(C_ID), C_ID, Name, FUN = seq_along)==1)
df1$MainRecord[i1] <- "X"

关于r - 标记基于参数的记录第一次出现在 r 数据框中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50138750/

相关文章:

ruby - 在 ruby​​ 中合并两个排序列表的内置方法

algorithm - 自然排序算法

Javascript好像没有被调用

R:积分:达到最大分割数,舍入误差

R chron %in% 比较仅识别每隔两个日期

r - 如何根据字符(小于号, "<")的出现重新计算数据框中的值?

r - blogdown + hugo,标签式代码块不显示主题 tranquilpeak

MySQL DATETIME 使用虚拟日期表排序

mercurial - 在进行 merge 之前要定位到哪个头?

opencv - 如何在 Dlib C++ 中获取头部姿势估计的 3D 坐标轴