r - 使用 R 在一行中查找唯一位置

标签 r dataframe

考虑以下数据框:

df <- data.frame(ID = 1:2, Location = c("Love, Love, Singapore, Love, Europe, United States, Japan, Amazon, Seattle, Orchard Road, Love", 
                                        "Singapore, Singapore, Singapore") , stringsAsFactors = FALSE)

我想从上面提到的 df$Location 列中找出唯一数据,也就是说我想获得一个新列,它只包含唯一的位置名称,就像下面提供的数据框一样;

df <- data.frame(ID = 1:2, Location = c("Love, Love, Singapore, Love, Europe, United States, Japan, Amazon, Seattle, Orchard Road, Love", 
                                        "Singapore, Singapore, Singapore") , 
                 Unique.Location = c("Love, Singapore, Europe, United States, Japan, Amazon, Seattle, Orchard Road",
                                     "Singapore"), stringsAsFactors = FALSE)

任何输入都会非常有用。

最佳答案

在 base R 中,我们可以用逗号分割字符串,并只为每个 Location 粘贴 unique 字符串

df$unique.Location <- sapply(strsplit(df$Location, ","), function(x) 
                       toString(unique(trimws(x))))

或者使用 tidyr::separate_rows 的另一种方式

library(dplyr)

df %>% 
  tidyr::separate_rows(Location, sep = ", ") %>%
  group_by(ID) %>%
  summarise(Unique.Location = toString(unique(Location)), 
            Location = toString(Location))

关于r - 使用 R 在一行中查找唯一位置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57214971/

相关文章:

pandas - 根据系列和数据帧中的内容生成 boolean 数据帧

python - 将 pandas 列值替换为字典值

r - 无法使用 par(new=T) 创建新的绘图窗口(设备?)

r - 如何选择数据框中不在索引列表中的行?

通过成对比较和多个标准从数据框中删除观察结果

python - ValueError : Length of values does not match length of index | Pandas DataFrame. 唯一()

r - 为什么 r/sqlite 需要主键?

python - 在 python 中应用等效项?

python - 如何从多个常见元素的嵌套列表创建数据框

dataframe - Julia DataFrame 中的多个条件