r - 从 R 中多个数据框中的列创建唯一值列表

标签 r dataframe

假设我有 3 个数据框(df1、df2、df3)来解释汽车的颜色、年份和品牌。每个数据框都有一个名为“id”的列。并非每个数据框中的所有 ID 都匹配,但我想在所有三个数据框中创建一个唯一 ID 列表。

 df1 looks like this:  

 id     color
 5A     black
 7T     green
 8Q     gold
 4D     white

 df2 looks like this:  

 id     make
 5A     BMW
 6N     Benz
 8Q     GM
 3G     Toyota

 df3 looks like this:  

 id     year
 5A     2003
 2B     2010
 8Q     1999
 4D     2007

这是制作 3 个数据框的代码:

 df1 <- data.frame(id=c("5A", "7T", "8Q", "4D"), color=c("black", "green", "gold", "white"))
 df2 <- data.frame(id=c("5A", "6N", "8Q", "3G"), make=c("BMW", "Benz", "GM", "Toyota"))
 df3 <- data.frame(id=c("5A", "2B", "8Q", "4D"), year=c(2003,2010,1999,2007))

我希望我的最终列表具有以下值:

 id
 5A
 7T
 8Q
 4D
 6N
 3G
 2B

我试过使用 unique() 但它只适用于一个向量?有什么想法吗?

最佳答案

unique(c(df1$id, df2$id, df3$id)) 

适用于数值。

unique(c(as.character(df1$id), as.character(df2$id), as.character(df3$id)))

将值作为字符返回,如果需要,您可以将它们操纵回因数。

关于r - 从 R 中多个数据框中的列创建唯一值列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23899078/

相关文章:

r - 当需要清除状态时,如何优雅地处理R中的错误?

r - 为什么 chisq.test 的 2 个输出在 R 中不同

R:网格布局标题

数据框中的 Pandas 聚合计数

scala - 如何计算 Spark Dataframe 中的列数?

python - 将 df reshape 为多索引并沿键连接

r - 使用 C 时在 R 向量中检测和分配 NA 值

python - 使用 aggfunc=sum 的 Pandas Dataframes 值计算在几列上

python - 删除列表中的重复数据框

R: 无法在 Ubuntu 14.04 上安装 'rasclass' 包