r - 我将如何编写 purrr::keep 的递归版本?

标签 r purrr

假设我有一个嵌套列表,其中包含一堆不同级别的数据框。我想仅提取数据框的扁平列表。我如何使用 purrr 写这个职能?我应该看 reduce ?

例如,给定数据:

s <- list(x = 1:10,
          data = data.frame(report = LETTERS[1:5],
                            value = rnorm(5, 20, 5)),
          report = list(A = data.frame(x = 1:3, y = c(2, 4, 6)),
                        B = data.frame(x = 1:3, y = c(3, 6, 9)),
                        z = 4:10,
                        other = data.frame(w = 3:5,
                                       color = c("red", "green", "blue"))))

我希望函数返回:
list(data = data.frame(report = LETTERS[1:5],
                       value = rnorm(5, 20, 5)),
     `report$A` = data.frame(x = 1:3, y = c(2, 4, 6)),
     `report$B` = data.frame(x = 1:3, y = c(3, 6, 9)),
     `report$other` = data.frame(w = 3:5,
                                 color = c("red", "green", "blue")))

我写了一个递归函数:
recursive_keep <- function(.x, .f) {
  loop <- function(.y) {
    if(is.list(.y)) {
      c(keep(.y, .f), flatten(map(discard(.y, .f), loop)))
    } else if(.f(.y)) {
      .y
    } else {
      NULL
    }
  }
  loop(.x)
}

它可以被称为:
recursive_keep(s, is.data.frame)

它似乎适用于这个示例,但它不保留名称信息。我希望保留足够的信息,以便我可以从原始对象中提取数据。也许这是一个更容易回答的问题?

最佳答案

这个具有一行正文的递归函数保留名称并且不使用包:

rec <- function(x, FUN = is.data.frame)
  if (FUN(x)) list(x) else if (is.list(x)) do.call("c", lapply(x, rec, FUN))

str(rec(s))  # test

给予(输出后继续):
List of 4
 $ data        :'data.frame':   5 obs. of  2 variables:
  ..$ report: Factor w/ 5 levels "A","B","C","D",..: 1 2 3 4 5
  ..$ value : num [1:5] 29.1 19.9 21.2 13 25.2
 $ report.A    :'data.frame':   3 obs. of  2 variables:
  ..$ x: int [1:3] 1 2 3
  ..$ y: num [1:3] 2 4 6
 $ report.B    :'data.frame':   3 obs. of  2 variables:
  ..$ x: int [1:3] 1 2 3
  ..$ y: num [1:3] 3 6 9
 $ report.other:'data.frame':   3 obs. of  2 variables:
  ..$ w    : int [1:3] 3 4 5
  ..$ color: Factor w/ 3 levels "blue","green",..: 3 2 1

关于获取,比如说,A从内部 report来自原始对象 s :
s[["report"]][["A"]]

或者
ix <- c("report", "A")
s[[ix]]

关于r - 我将如何编写 purrr::keep 的递归版本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48082797/

相关文章:

r - 具有用户定义函数和命名列表的 purrr::pmap

r - 将函数应用于参数网格并返回 purrr 中的列表列表

r - 为什么在执行 map(str_match_all()) 后需要将数据帧索引到 map() ?

r - 基于多个连续时间流计算行数

r - ggplot - 查找刻面间距的坐标

r - 如何在 Rmarkdown 中使用拼写检查?

r - 使用列表中的两个按行参数分割/过滤数据框

r - 寻求单行应用/ map /任何重复替换

r - 传单为什么会输出灰度图?

r - 加速运行 if.. else 循环在 R