r - 使用 R 在一行中查找唯一位置

考虑以下数据框:

df <- data.frame(ID = 1:2, Location = c("Love, Love, Singapore, Love, Europe, United States, Japan, Amazon, Seattle, Orchard Road, Love", 
                                        "Singapore, Singapore, Singapore") , stringsAsFactors = FALSE)

我想从上面提到的 df$Location 列中找出唯一数据，也就是说我想获得一个新列，它只包含唯一的位置名称，就像下面提供的数据框一样；

df <- data.frame(ID = 1:2, Location = c("Love, Love, Singapore, Love, Europe, United States, Japan, Amazon, Seattle, Orchard Road, Love", 
                                        "Singapore, Singapore, Singapore") , 
                 Unique.Location = c("Love, Singapore, Europe, United States, Japan, Amazon, Seattle, Orchard Road",
                                     "Singapore"), stringsAsFactors = FALSE)

任何输入都会非常有用。

最佳答案

在 base R 中，我们可以用逗号分割字符串，并只为每个 Location 粘贴 unique 字符串

df$unique.Location <- sapply(strsplit(df$Location, ","), function(x) 
                       toString(unique(trimws(x))))

或者使用 tidyr::separate_rows 的另一种方式

library(dplyr)

df %>% 
  tidyr::separate_rows(Location, sep = ", ") %>%
  group_by(ID) %>%
  summarise(Unique.Location = toString(unique(Location)), 
            Location = toString(Location))

关于r - 使用 R 在一行中查找唯一位置，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57214971/

上一篇：requirejs - 使用 Gulp 和 Gulp-Durandal 进行 Durandal 优化不起作用

下一篇：angularjs - 如何在 Angular Material 设计的网格列表中隐藏网格图 block ？

相关文章：

pandas - 根据系列和数据帧中的内容生成 boolean 数据帧

python - 将 pandas 列值替换为字典值

r - 无法使用 par(new=T) 创建新的绘图窗口(设备？)

r - 如何选择数据框中不在索引列表中的行？

通过成对比较和多个标准从数据框中删除观察结果

python - ValueError : Length of values does not match length of index | Pandas DataFrame. 唯一()

r - 为什么 r/sqlite 需要主键？

python - 在 python 中应用等效项？

python - 如何从多个常见元素的嵌套列表创建数据框

dataframe - Julia DataFrame 中的多个条件