r - 在缺少元素的子列表列表中扩充子列表作为 NA

标签 r list na

我有一个包含命名元素的列表列表(将它们称为“子列表”以避免混淆)。并非所有子列表都包含所有命名元素。我希望用 NA 来增加缺少元素的子列表。

例子:

l <- list(list(a = 1, b = 2, c = 3),
  list(a = 4, b = 5, c = 6),
  list(a = 7, b = 8),
  list(a = 9, c = 10))

可以看出,第 3 个和第 4 个子列表分别缺少 cb 元素。我希望这些元素被扩充为这些子列表的 NA,即:

res <- list(list(a = 1, b = 2, c = 3),
  list(a = 4, b = 5, c = 6),
  list(a = 7, b = 8, c = NA),
  list(a = 9, b = NA, c = 10))

实际上,如果这样更容易,每个子列表只缺少最后的 k 元素(即我没有遇到第 4 个子列表缺少中间元素 b 的情况),但我觉得我们应该找到一个通用的解决方案。

更新: 针对此特定场景获得了 3 个很好的解决方案,其中子列表元素是 int。但是元素可以是 chr,甚至是列表!例如:

l <- list(list(a = list(1,2), b = 2, c = 3),
      list(b = 5, c = 6),
      list(a = list(5,6), b = 8),
      list(a = list(7,8), c = 10))

a 元素是一个列表,应该在 res 列表中保持这种状态。如果它丢失了,我想要一个 NA,像往常一样:

res <- list(list(a = list(1,2), b = 2, c = 3),
  list(a = NA, b = 5, c = 6),
  list(a = list(5,6), b = 8, c = NA),
  list(a = list(7,8), b = NA, c = 10))

最佳答案

更新:我们可以创建唯一的名称,然后循环遍历列表并对这些名称进行子集化。不在列表中的名称将返回 NULL,我们将使用 NA 分配这些名称。这应该适用于所有输入。

# data
l <- list(list(a = list(1,2), b = 2, c = 3),
      list(b = 5, c = 6),
      list(a = list(5,6), b = 8),
      list(a = list(7,8), c = 10))

myNames <- unique(unlist(sapply(l, names)))

res <- lapply(l, function(i){
  x2 <- lapply(myNames, function(j){
    x1 <- i[[ j ]]
    if(is.null(x1)){ x1 <- NA}
    x1
    })
  names(x2) <- myNames
  x2
})

# check results
identical(res,
          #expected output
          list(list(a = list(1,2), b = 2, c = 3),
               list(a = NA, b = 5, c = 6),
               list(a = list(5,6), b = 8, c = NA),
               list(a = list(7,8), b = NA, c = 10)))
# [1] TRUE

原文: 我们可以将 sublist 视为数据框,并在缺少的列上填充 rbind,然后再次拆分:

# data:
l <- list(list(a = list(1,2), b = 2, c = 3),
          list(a = list(3,4), b = 5, c = 6),
          list(a = list(5,6), b = 8),
          list(a = list(7,8), c = 10))

library(dplyr)

# convert to dataframe and rbind with fill on missing columns
x <- bind_rows(lapply(l, as_data_frame))

# then convert it back to list
res <- lapply(split(x, seq(nrow(x))), as.list)

# drop names, we can skip this step if we want to keep names as 1,2,3,4...
names(res) <- NULL

# result
res

# [[1]]
# [[1]]$a
# [1] 1
# 
# [[1]]$b
# [1] 2
# 
# [[1]]$c
# [1] 3
# 
# 
# [[2]]
# [[2]]$a
# [1] 4
# 
# [[2]]$b
# [1] 5
# 
# [[2]]$c
# [1] 6
# 
# 
# [[3]]
# [[3]]$a
# [1] 7
# 
# [[3]]$b
# [1] 8
# 
# [[3]]$c
# [1] NA
# 
# 
# [[4]]
# [[4]]$a
# [1] 9
# 
# [[4]]$b
# [1] NA
# 
# [[4]]$c
# [1] 10

关于r - 在缺少元素的子列表列表中扩充子列表作为 NA,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44646006/

相关文章:

R 分配给列表中的第 i 个索引,其名称在循环中可变调用?

python - 如何从不同的索引开始迭代列表,并环绕

python - 检查一个值或值列表是否是Python中列表的子集的最快方法

r - 当 != 时,`case_when()` 通过 NA

R 删除第一行数据框,直到第一行没有 NA

r - 对 R 数据框进行子集化会导致神秘的 NA 行

r - 如何编写 for 循环,根据两个数据集(在 R 中)的另一个变量的相似性提取变量值?

r - 我如何在R中grep?

来自IP地址的邮政编码和其他地理数据的R包?

c# - 如何在 C# 中使用按键遍历列表